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CAPITULO  1 


Introducción 

1.  Comentarios  superficiales 

En  este  curso  vamos  a aprender  esencialmente  dos  cosas: 

■ Acotar, 

■ Optimizar. 

Están  relacionadas,  pues  optimizar  consiste  en  encontrar  “la  cota  máxi- 
ma o mínima” , la  mejor  de  todas  en  cierto  sentido. 

¿Pero  acotar  qué? 

Todo  lo  relacionado  con  funciones  de  una  variable  real  (para  lo  cual 
haremos  uso  de  las  nociones  de  continuidad,  derivabilidad  e integra- 
ción), sucesiones  y funciones  de  varias  variables  reales  (en  este  caso 
solo  estudiaremos  lo  relacionado  con  la  “derivabilidad”,  que  se  deno- 
mina diferenciación). 

En  la  vida  real  los  problemas  físicos  e ingenieriles  se  pueden  dividir 
en  tres  tipos: 

1.  Los  que  responden  a una  pregunta  directa  (¿cuánto  cuesta. . . ?). 

2.  Los  que  consisten  en  buscar  un  valor  óptimo  (¿cuál  es  la  máxima 
temperatura  que  alcanza  cierto  cuerpo  sujeto  a ciertas  condi- 
ciones? ¿cuál  es  el  volumen  máximo  que  se  puede  encerrar  con 
una  plancha  de  un  metro  cuadrado?. . . ) 

3.  La  búsqueda  de  cotas.  Quizás  estos  son  los  más  realistas  en 
muchos  casos.  Ejemplos:  ¿tengo  suficiente  agua  para  alimentar 
a todos  estos  camellos?  ¿resistirá  este  andamio  el  peso  de  to- 
dos estos  obreros?  ¿será  este  cable  suficientemente  ancho  para 
aguantar  la  potencia  eléctrica  que  pasará  por  él? 

Todos  los  ejemplos  expuestos  pueden  enunciarse  de  manera  sintética 
haciendo  uso  del  “lenguaje”  de  las  funciones,  la  continuidad,  la  in- 
tegración, la  derivación,  etc. . . Por  eso  es  interesante  esta  asignatura, 
porque  os  provee  del  lenguaje  adecuado  para  hacer  las  preguntas  de 
la  manera  correcta  (es  el  ingeniero  el  que  debe  trasladar  el  problema 
“real”  al  lenguaje  matemático:  los  matemáticos  no  sabemos  nada  de  la 
realidad). 

Acotar,  aunque  lo  veremos  con  detalle  en  los  múltiples  ejercicios 
que  haremos,  es  una  de  las  tareas  más  importantes  de  un  ingeniero, 
porque  habitualmente  no  hay  manera  de  conocer  la  solución  exacta  de 
un  problema  (puede  que  incluso  ni  siquiera  tenga  sentido  buscarla)  pero 
sí  hay  forma  de  saber  entre  qué  dos  valores  puede  estar  dicha  solución, 
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o bien  (lo  cual  es  suficiente  en  ciertos  casos),  más  de  cuánto  o menos  de 
cuánto  es  ese  valor  (dar  una  cota  inferior  o superior,  respectivamente). 
Eso  por  un  lado. 

2.  Conocer  las  herramientas 

Por  otro  lado,  sería  tonto  no  utilizar  las  herramientas  de  que  dis- 
ponemos hoy  en  día.  En  el  navegador  de  un  smartphone,  o en  un  orde- 
nador, váyase  a www.wolframalpha.com  (esta  dirección  es  de  conoci- 
miento obligatorio  en  esta  asignatura,  la  preguntaré  en  el  examen).  Es 
la  ventana  de  un  buscador,  pero  no  es  un  buscador.  Es  mucho  más. 

Escríbase  en  el  área  de  texto  lo  siguiente  (el  símbolo  entre  la  x y el 
2 es  un  acento  circunflejo: 

int (x/ (x~2+l) ,x) 

y dése  al  botón  (o  Enter).  Mágicamente,  se  obtiene  el  resultado 
de  la  fórmula 

/ dx  = \ log(*2  + !)  + c 

amén  de  un  montón  de  información  añadida  que  puede  ser  útilísima. 
Otro  ejemplo: 

limit (n  log(n~4-l)/log(n ! ) ,n, inf ) 

calcula  el  límite  de  la  sucesión  entre  paréntesis,  que  para  vosotros  puede 
ser  sencillo,  siempre  y cuando  conozcáis  la  fórmula  de  Stirling. 

En  las  prácticas  de  ordenador  utilizaréis  uno  de  los  programas  pa- 
ra cálculo  simbólico  que  hay  en  el  mercado.  Posiblemente  Maxima  o 
Matlab.  Pero  para  cuentas  “sobre  la  marcha”  sin  demasiadas  complica- 
ciones, WolframAlpha  es  una  herramienta  imprescindible.  Además  es 
mucho  más  que  una  calculadora  científica.  Varios  ejemplos: 

isoperimetric  problem 

max(-x~2  - y~2  +33) 
jupiter 

the  lord  of  the  rings 

Claro  que  hay  que  manejarlo  en  inglés,  pero  hoy  día  vivimos  en  ese 
idioma. 
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Funciones  de  una  variable  real 

En  este  capítulo  estudiamos  (repasamos)  los  conceptos  fundamenta- 
les del  cálculo  diferencial  de  una  variable  real.  El  objetivo  es  ser  capaz 
de  hacer  estudios  cualitativos  locales  de  las  funciones  reales  de  una 
variable  real,  y aprender  a utilizar  los  teoremas  fundamentales  para 
acotar. 

Sin  duda,  los  resultados  más  importantes  son: 

■ El  Teorema  de  Bolzano  (y  sus  corolarios). 

■ El  Teorema  del  valor  medio  de  Lagrange  (y  sus  corolarios  de 
acotación). 

■ La  noción  de  punto  crítico  y su  discernimiento. 

■ El  Polinomio  de  Taylor  y las  aproximaciones  y cotas  del  resto. 

Todos  ellos  habrán  de  saberse  de  memoria , porque  se  utilizan  cons- 
tantemente en  problemas  de  la  vida  real.  Quizás  alguno  se  presente 
“completamente”  demostrado,  pero  lo  que  es  esencial  es  conocer  su 
enunciado  con  precisión. 

Antes  de  definir  la  noción  de  función,  etc.  repasamos  someramente 
la  noción  de  número  real  — esencialmente  repasamos  el  Axioma  de  los 
intervalos  encajados — , poniendo  énfasis  en  el  principio  del  continuo. 

1.  Qué  es  M 

El  conjunto  básico  sobre  el  que  vamos  a trabajar  en  toda  esta  asig- 
natura — es  decir,  los  números  que  vamos  a utilizar — es  M,  el  cuerpo 
de  los  números  reales. 

Se  puede  definir  M de  la  siguiente  manera:  es  el  conjunto  más  pe- 
queño que  cumple  las  siguientes  condiciones: 

1.  Los  racionales  Q están  todos  en  R.  (esto  se  dice  Q C M,  están 
contenidos  en  él). 

2.  En  M se  puede  sumar  +,  restar  — , multiplicar  • y dividir  / (salvo 
por  0)  y el  0 y el  1 cumplen  sus  funciones  de  elementos  neutros, 
etc. . . 

3.  El  conjunto  M está  totalmente  ordenado  (dados  dos  números 
x,  y £ M,  se  tiene  que  o bien  x — y > 0 o bien  y — x > 0 o bien 
x = y),  y se  cumplen  las  condiciones  normales  del  orden  (luego 
las  enunciamos) . 

4.  Axioma  de  los  intervalos  encajados:  (esto  es  lo  que  diferen- 
cia a M de  Q):  si  an  y bn  son  dos  sucesiones  de  números  reales 
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tales  que  an  < an+ i < bn+\  < bn  (es  decir,  an  es  creciente,  bn 
es  decreciente  y las  an  son  todas  menores  que  las  bn),  y bn  — an 
tiende  a cero1,  entonces 


para  cierto  p6l. 

Gráficamente,  el  axioma  de  los  intervalos  encajados  dice  que  una  suce- 
sión de  intervalos  cerrados  y cada  vez  más  estrechos  contenidos  cada 
uno  en  el  anterior  contiene  un  número  real  (y  solo  uno)  en  su  interior. 
Esto  es  una  manera  “precisa”  de  decir  que  M.  está  lleno : no  solo  que 
entre  dos  números  reales  hay  otro  número  real  (pues  esto  pasa  para  los 
racionales,  también),  sino  que  si  uno  va  recortando  segmentos  cada  vez 
más  estrechos  hasta  anchura  cero,  uno  siempre  encuentra  algo  ahí 


a3  • • ■ an  bn  ...  á3  62 


cq  u 2 


J=H- 

P 


Figura  1.  Imagen  del  axioma  de  los  intervalos  encajados 

Es  bien  conocido  que  el  axioma  de  los  intervalos  encajados  no  es 
cierto  en  Q (es  conocido,  más  o menos  y en  otro  contexto,  desde  Pitágo- 
ras,  aunque  no  lo  dijera  así).  Si  l es  la  longitud  de  la  diagonal  de  un 
cuadrado  de  lado  1,  se  pueden  ir  dibujando  segmentos  de  longitud  ra- 
cional más  pequeñas  que  /,  pero  que  se  vayan  acercando  a ese  valor 
y otros  de  longitud  racional  máyor,  pero  no  hay  ninguno  de  longitud 
racional  l , porque  \/2  no  es  un  número  racional.  ¿Cómo  se  demuestra 
esto?  Es  bien  sencillo,  si  se  sabe  algo  sobre  factorizar  números  enteros 
y cómo  se  calculan  cuadrados  de  números  racionales. 

Recordamos,  antes  de  seguir,  una  noción  que  ha  de  ser  conocida  ya: 

Definición  1.  Un  intervalo  abierto  es  el  conjunto  de  números  ma- 
yores que  uno  a y menores  que  otro  6,  estrictamente.  Se  denota  (a,  b). 
Se  llama  intervalo  cerrado  [a,  b]  al  intervalo  abierto  junto  con  los  extre- 
mos a y b (es  decir,  tiene  dos  elementos  más  que  el  abierto,  salvo  en  el 
caso  a = b,  claro). 

Hablaremos  de  intervalo  extendido  cuando  admitamos  que  uno  de 
los  extremos  sea  +00  o —00  (o  ambos),  pero  por  lo  general  cualquier 
intervalo  sin  más  tendrá  los  extremos  en  M.  Si  uno  de  los  extremos  tiene 
un  corchete,  se  quiere  decir  que  se  incluye  ese  punto  en  el  intervalo: 
[a,  b)  = (a,  b)  U {a},  etc. 

Del  principio  de  los  intervalos  encajados  se  concluyen  otros  equiva- 
lentes (cualquiera  de  estos  se  puede  utilizar  como  axioma  básico  para 
construir  M a partir  de  Q): 

^sta  noción  no  la  hemos  definido,  pero  asumimos  que  el  lector  está  familiari- 
zado con  ella. 
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■ Cualquier  subconjunto  K C M acotado  superiormente  admite 
un  supremo.  Es  decir,  si  hay  un  número  M tal  que  M > k para 
cualquier  k e K , entonces  existe  un  M0  con  la  misma  propiedad 
que  es  el  más  pequeño  de  todos.  (Principio  del  supremo). 

■ Cualquier  subconjunto  Ií  C M acotado  interiormente  admite  un 
ínfimo. 

■ Si  A U i?  = M y ambos  son  no  vacíos  y cualquier  elemento  de  a 
es  menor  que  cualquier  elemento  de  B , entonces  existe  í el  tal 
que  a < t para  todo  a G A y t < b para  todo  b 6 B (particiones 
de  Dedekind). 

En  esos  enunciados  se  ha  utilizado  la  noción  de  “cota” , “supremo” 
e “ínfimo”.  Definimos: 

Definición  2.  Dado  un  conjunto  C c M,  se  dice  que  C está  acotado 
superiormente  si  existe  un  M 6 1 tal  que  M > c para  todo  c G C.  Se 
dice  acotado  inferiormente  si  ocurre  lo  mismo  pero  con  M < c para 
todo  c e C.  Se  dice  acotado  si  está  acotado  inferior  y superiormente. 

Cualquier  número  M que  cumple  la  condición  de  la  definición  se  lla- 
ma cota  superior  (o  inferior)  de  C.  Un  conjunto  acotado  superiormente 
“no  llega  hasta  infinito”,  mientras  que  uno  acotado  inferiormente  “no 
llega  hasta  menos  infinito”.  Un  conjunto  acotado,  es  uno  que  se  “cabe 
entre  dos  números  reales” . 

Definición  3.  El  supremo  de  un  conjunto  K c M es,  si  existe, 
la  menor  de  las  cotas  superiores.  El  ínfimo  es  la  mayor  de  las  cotas 
inferiores.  Si  el  supremo  está  en  K , entonces  se  llama  máximo  y si  el 
ínfimo  está  en  K,  entonces  se  llama  mínimo. 

Conjuntos  con  supremo  pero  no  máximo:  cualquier  intervalo  abierto 
(a,b). 

Algunos  ejemplos  más: 

■ El  conjunto  de  los  números  de  la  forma  ó,  cuando  n G N. 
Está  acotado  superiormente,  el  supremo  es  1,  que  es  máximo. 
Está  acotado  inferiormente,  el  ínfimo  es  0,  pero  no  es  mínimo. 

i i i i i 

n 4 3 2 1 


0 

FIGURA  2.  El  conjunto  {1  /n}ff=l  y su  ínfimo  (0),  que  no 
es  mínimo. 

■ El  conjunto  {x  G M|a;2  < 2}  está  acotado  superiormente,  no  in- 
feriormente, 3 es  una  cota  superior  y \/2  es  el  supremo. 
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y/2  3 


< 

> 

FIGURA  3.  El  conjunto  {x\x2  < 2}  (en  negro),  el  supre- 
mo (a/2)  y una  cota  (3). 

2.  Función,  función  inversa 

El  objeto  de  estudio  del  Cálculo  son  las  funciones.  La  definición 
precisa  es  poco  inteligible: 

DEFINICIÓN  4.  Una  función  real  de  variable  real  es  un  subconjunto 
itclxl  tal  que  si  (x,yi),  {x,y2)  G K entonces  y\  = y2. 

En  castellano:  una  asignación  de  un  número  y a cada  elemento  de 
un  subconjunto  X C M.  A cada  elemento  x G A",  se  le  asigna  y = f(x), 
si  la  función  se  llama  /.  Se  denota  así: 

/ : X — * M 
x i — > f(x) 

Por  ejemplo,  la  función  que  a cada  elemento  de  M le  asigna  su  cuadrado 
más  5.  En  este  caso,  el  “origen”  es  M y el  conjunto  final  es  M: 

/ : R — » M. 
x i — * x2  + 5 

La  función  que  a cada  real  positivo  le  asigna  su  raíz  cuadrada  posi- 
tiva está  definida  solo  en  la  parte  positiva  de  M.  (junto  con  el  0),  que 
designamos  M>o: 

/ : ®Uo  — > ^ 
x i — > \/x 

(se  suele  poner  así,  sin  signo  antes  de  la  raíz  cuadrada). 

DEFINICIÓN  5.  El  dominio  de  definición  de  una  función  / es  el 
conjunto  en  el  que  está  definida.  El  recorrido  es  el  subconjunto  de  M 
“de  valores  tomados  por  la  función”,  es  decir,  de  aquellos  ¡/El  para 
los  que  existe  un  x en  el  dominio  con  f(x)  = y. 

Las  siguientes  nociones  lian  de  ser  conocidas: 

Definición  6.  Una.  función  / : X — * Y es 
Inyectiva:  si  /(aq)  = f(x2)  implica  x\  = x2.  Es  decir,  si  cada 
valor  es  tomado  solo  una  vez. 

Sobreyectiva:  si  para  cada  y G Y hay  un  x tal  que  f(x)  = y.  Es 
decir,  si  “llena”  el  conjunto  Y. 

Biyectiva:  Si  es  inyectiva  y sobrcllectiva  (llena  el  conjunto  Y y 
además,  no  se  “repiten”  valores). 
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Dadas  dos  funciones  se  llama  composición  de 

/ con  g a la  función  / o g dada  por  f o g(x)  = f(g(x)). 

Una  función  biyectiva  tiene  inversa : 

Definición  7.  Si  / : X — » Y es  una  función  biyectiva,  se  llama 
inversa  de  /,  y se  denota  /_1  : Y — > A"  a la  función  que  asocia  a cada 
y G y el  único  elemento  x E X tal  que  /(t)  = y. 

Gráficamente,  la  función  inversa  de  una  función  real  de  variable  real 
se  dibuja  “reflejando  la  gráfica  en  la  recta  y — x” : 


ZJ I I I L 

-1  -0,5  0 0,5  1 


Figura  4.  Función  inversa  (en  azul)  de  la  función  x3 
(en  negro).  Ambas  son,  obviamente,  biyectivas. 


3.  Límite  de  una  función 

3.1.  Infinitésimo.  Todo  nuestro  desarrollo  de  la  continuidad, 
derivabilidad  y (en  el  futuro)  difcrenciabilidad  de  funciones  se  basará  en 
la  noción  de  “función  que  se  hace  muy  pequña”  cuando  la  variable  es 
pequeña.  Llamaremos  a esto  un  “infinitésimo”  o una  “cantidad  dife- 
renciar’ (pero  este  término  no  lo  usaermos  mucho): 

Definición  8.  Un  infinitésimo  en  0 o una  cantidad  diferencial  (o, 
brevemente,  una  diferencial ) es  una  aplicación  d : (—a,  a)  — > M de  un 
entorno  de  0 en  M tal  que  para  cualquier  número  (por  pequeño  que  sea) 
£ > 0,  existe  un  entorno  (— c,  c)  tal  que  \d(h)\  < £ en  todo  (— c,  c). 

El  “en  0”  se  verá  en  el  futuro  a qué  se  debe.  De  momento,  no  lo 
utilizaremos  nunca  porque  hasta  que  los  necesitemos,  no  hablaremos 
de  infinitésimos  en  otros  puntos. 
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Figura  5.  La  función  / es  inyectiva  de  [0, 1]  a [0,  2]  pero 
no  sobre.  La  función  q es  sobreyectiva,  pero  no  inyectiva 
de  [-1,1]  a [0,1]. 

Es  decir,  un  infinitésimo  es  una  función  que  “es  más  pequeña”  (en 
valor  absoluto)  que  cualquier  cantidad  positiva.  Es  “más  pequeña” , por 
así  decir,  “a  partir  de  un  momento”. 


Figura  6.  Infinitésimos  y funciones  que  no  lo  son. 

La  utilidad  de  esta  definición  (que  cae  en  el  examen)  es  que  todas 
las  nociones  dinámicas  se  pueden  enunciar  utilizando  infinitésimos,  en 
lugar  de  utilizar  permanentemente  el  lenguaje  de  épsilons  y deltas,  que 
es  mucho  más  farragoso.  Solo  hay  que  entender,  de  una  vez  por  todas, 
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que  una  cantidad  diferencial  representa  una  función  que  “se  acerca  a 
cero  según  la  variable  se  acerca  a cero” . 

Vamos  a utilizar  muchas  veces  las  siguientes  propiedades: 

Teorema  1 (Propiedades  de  los  infinitésimos).  Sean  /,  g : (—a,  a)  - 
M dos  infinitésimos.  Entonces: 

■ La  suma  y la  resta  f ± g son  infinitésimos. 

■ El  producto  fg  es  un  infinitésimo. 

■ La  composición  g o f es  un  infinitésimo2 . 

■ Si  f(x)  0 entonces  el  inverso  1//  es  un  infinito:  dado  cual- 
quier número  M > 0 existe  un  intervalo  (— c,  c)  tal  que  \f(x)\  > 
M para  todo  x G (— c,  c)  (es  decir,  el  inverso  de  un  infinitésimo 
se  hace  infinitamente  grande”.) 

La  noción  clave  de  toda  la  asignatura  es  la  de  límite  de  una  función 
en  un  punto.  Antes  precisamos  una  noción 

Definición  9.  Se  dice  que  a es  un  punto  adherente  a un  conjunto 
X si  cualquier  intervalo  abierto  que  contiene  a a corta  a X en  algún 
punto  (es  decir,  si  a está  en  X o muy  cerca  de  él).  Se  escribe  a G X. 
Se  dice  que  a es  un  punto  de  acumulación  si  cualquier  intervalo  que 
contiene  a a corta  a X en  un  punto  distinto  de  a.  Se  escribe  a G X' . 

Definición  10.  Sea  / : X — > M una  función  real  de  variable  real 
(es  decir,  X cl)y  sea  a G X'  un  punto  de  acumulación  de  X.  Se  dice 
que  l es  el  limite  de  f cuando  x tiende  a a y se  escribe 

lím  f(x)  = l 

x—>a 

si  existe  un  infinitésimo  d tal  que  /(a  + h)  = l + d(/i)  para  \h\  > 0 (y 
siempre  que  a + /iG  A",  obviamente). 

Es  decir,  l es  el  límite  de  / en  a si  /(a  + h ) es  muy  cercano  a l 
cuando  h es  muy  próximo  a cero.  Si  esto  ocurre  solo  por  “un  lado”,  se 
habla  de  límite  por  la  derecha  y de  límite  por  la  izquierda : 

Definición  11.  Si  existe  un  infinitésimo  d tal  que  /(a  + h)  = 
l + d (h)  para  h > 0 entonces  se  dice  que  / tiene  límite  l por  la  derecha. 
Si  ocurre  lo  mismo  pero  para  h < 0,  entonces  se  dice  que  el  límite  es  por 
la  izquierda.  Obviamente,  si  ocurren  ambas  cosas  es  porque  el  límite 
de  / en  a es  l. 

Nota  1.  La  definición  que  hemos  dado  es  equivalente  a la  clásica 
definición  para  todo  £ > 0 existe  un  S > 0 tal  que  \h\  < 5 implica 
\f(a  + h)  — l\  < e,  pero  pienso  que  es  más  sencilla  de  entender,  por 
ser  más  natural  (un  número  es  el  límite  si  la  función  vale  ese  número 
más  algo  muy  pequeño  cerca  del  punto).  Se  puede  imaginar  la  noción 
“clásica”  de  límite  como  una  condición  “dialogada”.  Supongamos  que 

2Donde  está  definida,  que  es  en  un  entorno  un  poco  más  pequeño 
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hay  dos  “jugadores”,  Ana  y Basilio.  El  número  l es  el  límite  de  / en  a 
si  para  cualquier  elección  que  haga  Ana  de  una  distancia  en  “vertical” , 
Basilio  puede  encontrar  una  distancia  en  “horizontal”  tal  que  cualquier 
punto  que  esté  más  cerca  de  a de  lo  que  dice  Basilio,  tiene  la  imagen 
más  cerca  de  l de  lo  que  dice  Ana. 

La  función  sen(l/x)  para  x > 0 no  tiene  límite  en  0:  dado,  por 
ejemplo,  e = 1/2,  hay  puntos  x dentro  de  cualquier  entorno  (0,  S)  para 
los  cuales  |sen(l/x)  — 0|  > 1/2  (por  ejemplo,  todos  los  puntos  de  la 
forma  (2fc^1)7r,  para  k G N). 


Figura  7.  La  función  f(x)  = sen(l/x)  no  tiene  límite 
en  0. 

Existen  también  las  nociones  de  límite  infinito  y límite  en  el  infinito. 
Antes  de  nada,  utilizamos  parte  del  Teorema  1 para  definir  la  noción 
de  función  que  se  hace  infinito. 

Definición  12.  Se  dice  que  f : (a  — e,  a + e)  — > M es  un  infinito 
en  a si  dado  cualquier  M > 0,  hay  un  5 tal  que  f{x)  > M para 
x G (a  — ó,  a + ó)  y x j -a.  Si  solo  ocurre  para  x G (a,  a + S),  se  habla 
de  infinito  por  la  derecha  de  a,  y si  es  para  (a  — S,  a),  de  infinito  por  la 
izquierda  de  a.  Si  lo  que  ocurre  es  que  f(x)  < — M,  entonces  se  habla 
de  un  menos  infinito  (pero  nunca  diremos  esto). 

Definición  13.  Se  dice  que  / : X — > M tiene  límite  +oo  en  un 
punto  c de  acumulación  de  X si  existe  un  infinito  positivo  I : (—h,  h ) — > 
M tal  que 

f(c+h)  = I(h) 

para  h 6 (—a,  a)  (y,  como  siempre,  c + h E X,  pero  esto  es  obvio).  Si 
el  infinito  es  negativo  ( I(x ) < 0)  entonces  se  habla  de  límite  — oo. 

Para  definir  el  límite  en  infinito,  recurrimos  en  parte  a la  noción 
clásica,  pero  nunca  más  lo  haremos: 
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Definición  14.  Se  dice  que  / : X —>  M tiene  límite  l en  +oo  si 
para  cualquier  £ > 0 existe  K > 0 tal  que  | f(x)  — l\  < e para  todo 
x > K. 

Se  dice  que  el  límite  en  +cx)  es  +oo  para  todo  M > 0 existe  K > 0 
tal  que  f{x)  > M si  x > K. 

Para  — oo  y todo  lo  demás,  no  hay  más  que  cambiar  los  signos. . . 

Al  final  todo  termina  en  una  mecánica  que  el  alumno  ya  debería 
conocer. 

3.2.  Mecánica  del  cálculo  de  límites.  No  vamos  a estudiarla 
en  detalle  en  estos  apuntes.  Este  es  uno  de  los  pocos  apartados  en  que 
vamos  a dar  por  supuesto  que  el  alumno  ya  conoce. 

4.  Continuidad,  límites 

La  última  definición  de  la  sección  anterior,  la  de  limite  es  el  pri- 
mer paso  para  poder  hacer  un  análisis  local  de  las  funciones,  es  decir, 
para  “distinguir”  qué  funciones  tienen  un  comportamiento  “normal”  y 
cuáles  no.  El  objetivo  de  una  definición  es  precisamente  ese:  dividir  pa- 
ra aclarar.  ¿Qué  aclara  la  noción  de  límite?  La  idea  (y  esta  es  la  única 
idea  importante  del  análisis)  de  que  cuando  uno  se  aleja  muy  poco  del 
punto  a,  la  función  se  aleja  muy  poco  de  /,  eso  es  lo  que  significa  la 
expresión 

lím  f(x)  = l. 

tr— >a 

La  clave  es  precisamente  esa:  cuando  uno  está  muy  cerca  de  a,  la  función 
está  muy  cerca  de  l.  Esto  es  distinto  de  decir  que  / se  acerca  “todo  lo 
que  yo  quiera”  a l cuando  x se  acerca  a a , porque  esta  frase  es  verdad 
para  la  función  sen(l/a:)  (ver  figura  7)  respecto  del  valor  1 cuando  x 
se  acerca  a 0,  pero  es  obvio  que  esta  función  no  tiene  límite  1 en  0.  De 
hecho,  como  se  ve  en  su  gráfica,  no  puede  tener  ningún  límite-,  cuando 
x se  aleja  un  poco  de  0,  el  valor  f(x)  puede  acercarse  a cualquier  valor 
entre  —1  y 1. 

Con  esta  idea,  es  evidente  que  la  siguiente  función  tiene  límite  en 
a = 1,  y el  límite  es  2,  aunque  la  función  en  1 valga  0,83.  Esto  es  un 
ejemplo  del  principio  primero  de  los  límites:  El  valor  de  la  función 
en  el  punto  no  tiene  nada  que  ver  con  el  límite. 

Precisamente  la  idea  de  que  el  límite  debe  estar  relacionado  con  el 
valor  de  la  función  es  lo  que  lleva  a la  definición  de  continuidad  de  una 
función  en  un  punto.  Tanto  en  la  Figura  8 como  en  la  7,  se  observa  que 
el  comportamiento  de  la  gráfica  cerca  del  punto  en  que  se  está  mirando 
el  límite  es  “extraño” . Esa  extrañeza  se  llama  “discontinuidad” . 

Definición  15.  Se  dice  que  una  función  / : X — > M es  continua  en 
a G X si  / tiene  límite  en  a y además 

lím  f(x)  = f(a) 

tr— >a 
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FIGURA  8.  Función  con  límite  en  a = 1,  pero  con  valor 
distinto  del  límite. 

es  decir,  si  el  límite  coincide  con  el  valor  de  la  función  en  el  punto. 

Si  / es  continua  en  todos  los  puntos  de  A",  entonces  se  dice  que  / 
es  continua  en  X. 

Uniendo  esta  definición  y la  de  límite,  es  mucho  más  sencillo  enun- 
ciarlo así: 

Definición  16.  Se  dice  que  / : X —>  M es  conínua  en  a g A"  si 
existe  un  infinitésimo  d tal  que 

f(a  + h)  = f(a ) + d (h) 
para  h G (— c,  c)  y a + h G X. 

Si  solo  ocurre  para  h G (0,  c),  se  habla  de  continuidad  por  la  derecha 
y si  es  para  h G (— c,  0),  de  continuidad  por  la  izquierda. 

Cuando  A"  es  como  un  intervalo,  la  continuidad  en  todo  X se  pue- 
de resumir  gráficamente  diciendo  que  la  gráfica  f se  puede  pintar  sin 
levantar  el  lápiz  del  papel. 

También  se  consideran  los  límites  por  la  derecha  y por  la  izquierda 
de  un  punto  o G 1 y se  habla  de  continuidad  por  la  derecha  y por  la 
izquierda.  No  vamos  a insistir:  una  función  es  continua  en  un  punto  si 
y solo  si  los  límites  laterales  coinciden  con  el  valor  de  la  función  en  el 
punto. 

4.1.  Las  funciones  racionales  son  continuas.  Es  muy  sencillo 

comprobar  lo  siguiente: 

■ Las  funciones  constantes  f(x)  = c para  c G M.  son  continuas  en 
todo  M.  Su  límite  en  cada  punto  es  c. 

■ La  función  f(x)  = x es  continua  en  todo  M.  Su  límite  en  cada 
punto  es  x.  Sería  oportuno  tratar  de  probar  esto. 
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■ Si  f(x)  y g(x)  son  continuas  en  a,  entonces  f(x)  + g(x)  y 
f(x)g(x)  son  continuas  en  a y sus  límites  son,  en  cada  pun- 
to a,  f (a)  + g(a)  y f(a)g(a). 

■ Si  f(x)  es  continua  en  a y líma;_>a(/(x))  0,  entonces  1 / f(x) 

es  continua  en  a y su  límite  en  a es  l//(a).  Probar  esto  puede 
ser  una  buena  idea. 

■ Si  r > 0 es  un  número  real  positivo,  entonces  rx  es  continua 
en  todo  M y su  límite  es  rx  en  cada  punto.  Esto  es  sencillo  de 
comprobar. 

■ Si  f(x)  es  continua  en  [c,  d]  y g(x)  es  continua  en  [/(c),/(d)] 
(bien  ordenado)  entonces  g(f(x))  es  continua  en  [c,  d]  y el  límite 
en  cada  punto  a G [c,  d]  es  g(/(a)).  Este  resultado  es  bien  fácil 
de  “demostrar”  utilizando  infinitésimos.  Solo  se  ha  de  compro- 
bar que  g(f(a  + h ))  es  g(/(a))  + d(fi),  donde  d es  cierto  infi- 
nitésimo, pero  como  / es  continua,  hay  un  infinitésimo  di  tal 
que: 

g(f(a  + h))  = g(f(a)  + dx  (h)) 
y como  g es  continua  en  f(a),  hay  otro  d2  tal  que 

g(f(a  + Mh)))  = g(f(a)  + Mh))  = 
g(f(a))  + d2(d1(h))  = g(f(a))  + d(h) 

donde  d es  infinitamente  pequeño 3,  así  que  g o / es  continua. 
Este  razonamiento  es  correcto  pero  el  lenguaje  no  lo  conocéis. 
No  importa,  así  se  hacen  las  cosas. 

■ Etcétera  (no  voy  a seguir  con  todas  estas  nociones  bien  conoci- 
das). 

A partir  de  la  lista  de  resultados  anteriores  se  deduce,  por  ejemplo,  que 
todas  las  funciones  racionales 

f(x)  = P(x)/Q(x) 

son  continuas  en  todo  M salvo  quizás  en  los  ceros  de  Q(x)  (de  hecho,  si 
la  fracción  racional  está  simplificada,  en  los  ceros  de  Q(x)  hay  siempre 
una  discontinuidad,  pero  solo  si  / está  simplificada). 

Pero  también  un  montón  de  otras  funciones  lo  son.  Ahora,  la  pre- 
gunta es  ¿cómo  son  las  funciones  discontinuas?  ffay  tres  tipos:  dos  ya 
se  han  visto  en  las  Figuras  7 y 8:  son  dos  funciones  que  no  pueden  di- 
bujarse sin  levantar  el  lápiz  del  papel.  Hay  otro  tipo:  cuando  la  función 
se  va  a infinito : 

Definición  17.  Una  función  discontinua  en  a se  dice  que  tiene  una 
discontinuidad 

Evitable:  Si  la  función  tiene  límite  en  a pero  /(a)  no  es  igual  a 
dicho  límite. 

3Porque  la  composición  de  infinitésimos  es  un  infinitésimo,  como  se  vio  en  el 
Teorema  1. 
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De  salto  finito:  Si  el  límite  por  la  derecha  es  distinto  del  límite 
por  la  izquierda  y ambos  existen. 

De  salto  infinito:  Si  los  límites  laterales  existen  y uno  de  ellos 
es  infinito. 

Esencial:  Si  uno  de  los  dos  límites  laterales  ni  existe  ni  es  infinito. 


100 


50 


-50 


-100 


lililí 

f(x)  - X\:.vx  ^ 0 - o 

.V 

1 1 1 

0 0,5  1 1,5  2 2,5  3 


Figura  9.  Función  con  límite  +oo  por  la  derecha,  — oo 
por  la  izquierda.  Obviamente,  discontinua  en  1.3. 


5.  Los  teoremas  básicos  de  la  continuidad 

Hay  tres  resultados  que  hay  que  saberse  de  memoria,  tal  y como 
están  enunciados,  relativos  a propiedades  obvias  de  las  funciones  con- 
tinuas en  intervalos  cerrados,  que  son  de  la  máxima  utilidad.  Previa- 
mente se  demuestra  siempre  una  propiedad  clave:  una  función  continua 
que  no  es  nula  en  un  punto  c tiene  signo  constante  en  un  entorno  de  c: 

Lema  1.  Si  f : (a,  b)  es  continua  en  un  punto  c G (a,  b)  y f(c. ) ^ 0, 
entonces  existe  S > 0 tal  que  el  signo  de  f en  (c  — 5,  c + 5)  es  el  mismo 
que  en  c. 

Demostración.  Vamos  a demostrarlo,  aunque  sea  para  tener  una 
idea.  En  el  punto  c,  la  función  vale  /(c)  que,  por  ejemplo,  es  mayor 
que  cero  (si  es  menor,  se  hace  un  razonamiento  análogo).  Como  / es 
continua  en  c,  se  sabe  que  existe  un  infinitésimo  d tal  que 

f(c  + h)  = /(c)  +d(h). 

Pero  por  definición  de  infinitésimo,  hay  un  entorno  (—5,5)  tal  que 
|d(h)|  < /(c)  en  todo  ese  entorno,  de  manera  que 

/(c)  + d (h)  > 0 
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Figura  10.  El  signo  es  constante  en  un  entorno  de  un 
punto  de  continuidad. 

para  h G (— 5,  y por  tanto 

f(c  + h)  = f (c)  + d (h)  > 0 

para  los  mismos  h.  Así  que  si  x G (c  — 5,  c + 5),  se  cumple  que  f(x) 

0. 

Teorema  2 (Teorema  de  Bolzano).  Si  f : [a,  b]  — ► M es  una  función 
continua  definida  en  un  intervalo  cerrado  y f (a)  y f(b ) tienen  distinto 
signo  (es  decir,  f(a ) ■ f(b)  < 0),  entonces  existe  al  menos  un  punto 
xq  G (a,  b)  tal  que  f(x o)  — 0)- 


FIGURA  1 1 . Teorema  de  Bolzano. 


□ V 
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Teorema  3 (Teorema  del  valor  intermedio).  Sea  f : [a,  b]  — > M una 
función  continua  en  [ a,b\ . Si  c es  un  valor  entre  f(a ) y f(b),  entonces 
existe  x0  G [a,  b]  tal  que  f(x0 ) = c. 

Téngase  en  cuenta  que  en  este  resultado,  el  valor  c puede  ser  tanto 
/(a)  como  f{b)  y por  ello  xQ  puede  ser  uno  de  los  extremos.  La  prueba 
de  este  teorema  es  una  tontería,  utilizando  la  función  g(x)  = f(x)  — c 
y el  Teorema  de  Bolzano. 

El  siguiente  resultado  significa  que  “una  función  que  se  puede  di- 
bujar sin  levantar  el  lápiz  tiene  cabe  en  un  papel  pequeño”: 

Lema  2.  Si  f : [a,  b]  — > M.  es  continua,  entonces  el  conjunto  / ([a,  b]) 
de  imágenes  está  acotado  superior  e inferiormente. 

Teorema  4 (Teorema  de  Weierstrass) . Sea  f : [a,b\  — > M una 
función  continua  en  [a,b\.  Sean  M = máx{/(x)|x  G [a,b]}  y m = 
mín{/(:r) \x  G [a,  6]}  el  máximo  y el  mínimo  de  los  valores  de  f en  [a,  b] . 
Entonces  existen  puntos  c,  C G [a,  b]  tales  que  /(c)  = m y f(C)  = M. 


Figura  12.  Teorema  de  Weierstrass. 

Un  corolario  clásico  del  Teorema  de  Bolzano  es  el  siguiente  enuncia- 
do: si  subes  una  montaña  un  día,  comenzando  a una  hora  determinada 
y al  día  siguiente  la  bajas  comenzando  a la  misma  hora  y terminando 
a la  misma,  entonces  hay  un  momento  de  la  bajada  en  que  estabas 
justamente  en  ese  sitio  al  subir: 

Lema  3.  Si  f : [a,  b]  — > M y g : [a,  b]  — > M son  tales  que  f(a)  < f{b), 
g(a)  = f{b)  y g{b)  = /(a)  entonces  existe  un  punto  c G (a,  b)  tal  que 

g(c)  = f(c). 

Demostrar  esto  es  muy  fácil:  en  vez  de  hacer  la  subida  un  día  y la 
bajada  al  siguiente,  hace  una  persona  la  subida  y otra  la  bajada:  en 
un  momento  dado  han  de  cruzarse  (porque  se  supone  que  uno  va  de 
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FIGURA  13.  Teorema  de  Weierstrass:  el  máximo  o míni- 
mo puede  estar  en  uno  de  los  extremos. 

manera  continua  por  una  montaña,  no  se  teleporta , al  menos  a día  de 
hoy  (2011)). 


6.  Derivabilidad 

La  noción  de  continuidad  es  la  primera  noción  gráfica  del  Cálcu- 
lo: discierne  las  funciones  que  “no  tienen  saltos”.  O,  visto  desde  otra 
perspectiva,  es  la  primera  noción  infinitesimal:  discierne  las  funciones 
que  “crecen  muy  poco”  cuando  la  variable  “crece  poco”  (recordemos, 
f(a  + h)  = f(a ) + d (h)).  Pero  es  obvio  que  no  es  la  única  noción  lo- 
cal que  se  puede  estudiar.  Desde  el  punto  de  vista  físico  (y  la  Física  es 
quien  mueve  a las  Matemáticas  salvo  en  excepciones  muy  puntuales)  es 
conveniente  saber  cómo  identificar  funciones  que  “se  comportan  bien” 
dinámicamente.  La  primera  noción  dinámica  más  allá  de  la  continui- 
dad es,  claramente,  “dar  las  curvas  sin  violencia”.  Es  decir,  no  tener 
esquinas. 

Una  “esquina”  es  un  lugar  en  que  “por  un  lado  se  va  en  una  dirección 
y por  otro  lado  se  va  en  otra” . 

Dirección  = recta  tangente 

Una  recta  “no  vertical”  (veremos  qué  pasa  con  las  verticales)  en  el 
plano  tiene  ecuación 

y = ax  + b 

donde  a es  “la  pendiente”  (a,  de  hecho,  es  justamente  la  pendiente  en 
el  sentido  de  las  carreteras:  una  cuesta  del  8 % se  escribe  como  una 
recta  y = 0,08x  + • • • ) y b se  puede  calcular  una  vez  que  se  conoce  un 
punto  por  el  que  pasa  la  recta  y su  pendiente.  Es  obvio  que  la  dirección 
de  una  recta  es  el  parámetro  a (las  rectas  paralelas  tienen  todas  la 
misma  dirección),  así  que  para  hablar  de  dirección  solo  nos  interesa 
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conocer  la  pendiente  de  la  recta  tangente  a la  gráfica  de  una  función. 
Intuitivamente  es  fácil  convencerse  de  que  la  recta  tangente  a un  punto 
es  el  límite  (si  existe)  de  las  secantes  que  pasan  por  ese  punto  y otro 
infinitamente  próximo  a él. 


Figura  14.  Recta  tangente  y una  secante  “cercana”. 


Como  todo  el  mundo  sabe , la  recta  que  pasa  por  los  puntos  (a,  /(a)) 
y (a  + h,  /(a  + h))  tiene  por  ecuación 


(1) 


y = 


f(a  + h)  - f(á) 

/ 7 \ \ 

[a  + h)  — a 


a)  + /(a). 


(Insisto  en  que  esto  debería  saberlo  todo  el  mundo).  La  idea  de  que 
“exista  la  recta  tangente”  es  que  esa  expresión  tenga  sentido  “para 
valores  infinitamente  pequeños”  de  h.  Como  /(a)  es  un  número  bien 
concreto,  lo  único  que  hace  falta  es  que  esta  otra  expresión  tenga  sen- 
tido: 

f(a  + h)  - /(a)  _ f(a  + h)  - /(a) 

(a  + h)  — a h 

Es  decir,  que  el  cociente  del  incremento  de  f respecto  del  incremento  de 
x sea  un  número  real  cuando  ambos  incrementos  son  infinitesimales. 
Para  esto  es  suficiente  con  que  el  incremento  de  / sea  del  orden  del 
incremento  de  x,  cuando  este  es  muy  pequeño,  y que  el  cociente  tenga 
sentido.  En  fin,  de  manera  formal  clásica: 


Definición  18.  Se  dice  que  / : X — > M es  derivable  en  un  punto 
de  la  adherencia  de  X,  a G X si  existe  el  siguiente  límite 

lím  MxlM. 

x£X,x—>a  (x  — a) 

Cuando  haya  un  entorno  de  a en  X,  se  puede  escribir 


lím 

h^O 


f(a  + h)  - /(a) 


h 
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Al  valor  de  dicho  límite  se  le  llama  derivada  de  f en  a y se  denota  f'(a ) 
o bien  ¿(a).  Se  dice  que  / es  derivable  en  A"  si  es  derivable  en  todos 
los  puntos  de  A". 

Esta  es  la  definición  newtoniana  de  derivabilidad.  Es  mucho  más 
fácil  enunciarla  como  lo  haría  Leibniz:  / es  derivable  si  existe  un  infi- 
nitésimo d tal  que 

/(a+,A/(a) = k + d (h) 

h 

donde  k E M es  independiente  de  d y dy  es  un  infinitésimo  cuando  d lo 
es.  Nótese  que  k no  puede  ser  infinito,  pues  es  un  número:  k = f(a). 

Como  se  ve  en  ambas  definiciones,  la  inclinación  de  la  secante  infi- 
nitamente próxima  se  mide  escribiendo  la  ecuación  de  la  secante  como 
arriba,  y = kx  + b y calculando  la  a (pues  la  b se  deduce  del  punto 
(a,  /(a))).  Esto  hace  que,  si  existe  una  única  recta  tangente,  entonces 
su  pendiente  a viene  definida  por  el  valor  k = /'(a).  Sin  embargo,  como 
se  ve  en  el  ejemplo  de  \/\x\,  es  posible  que  una  función  tenga  una  recta 
tangente  en  un  punto  pero  no  tenga  derivada  (esto  ocurre  cuando  la 
tangente  es  vertical ),  porque  la  ecuación  de  una  recta  vertical  es  de  la 
forma  x — c,  y nunca  de  la  forma  y — kx  + c.  Así  pues: 

Una  función  / es  derivable  en  a 
si  su  grafo  tiene  una  sola  tangente  en  (a, /(a)) 
y esta  no  es  vertical. 


Figura  15.  La  función  valor  absoluto  |x|  no  es  derivable 
porque  “llega  con  dos  tangentes”  a x = 0.  La  función 
sg(x)  \J\x\  (sff(x)  es  el  signo  de  x)  no  lo  es  porque  “es 
vertical”  en  x = 0. 

Vamos  a “demostrar”  una  propiedad  esencial  de  las  funciones  deri- 
vables: 

Lema  4.  Si  f : X — > M es  derivable  en  a,  entonces  es  continua  en 

a. 
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Demostración.  Podríamos  liarnos  con  £ y ó,  pero  es  mucho  más 
fácil  usar  infinitésimos.  Que  sea  derivadle  en  a quiere  decir  que  existe 
k G M tal  que 

/(a+,í,)-/(a)  = k + a w 

h 

donde  d es  un  infinitésimo.  Pero  despejando,  queda 

f(a  + h)  — f(a ) + (k  + d {h))h  = f(a)  + di(h) 

(donde  d\{h)  es  un  infinitésimo,  obviamente),  es  decir,  que  f(a  + h ) es 
/(a)  más  un  infinitésimo,  que  es  justamente  la  noción  de  continuidad 
según  la  Definición  15.  □ 

Esto  significa  que  ser  derivable  es  más  fuerte  que  ser  continua.  La 
derivabilidad  es  lo  que  uno  espera  de  los  procesos  físicos  no  traumáticos 
de  magnitud  no  cuántica  (los  procesos  cuánticos  pueden  ser  discretos, 
no  continuos,  y requieren  otro  tipo  de  estudio).  El  interés  de  todo  el 
resto  de  este  tema  (y  de  estudiar  funciones  varias  veces  derivadles, 
etc.)  reside  precisamente  en  que  permite  conocer  con  detalle  los  proce- 
sos físicos  más  habituales.  Existen  procesos  físicos  que  no  se  describen 
mediante  funciones  derivables,  o incluso  continuas,  pero  esos  casos  sin- 
gulares no  hacen  que  el  caso  general  deje  de  ser  interesante.  De  hecho, 
conocer  el  caso  general  es  lo  más  útil  (sirve  más  saber  conducir  por 
carretera  que  saber  pilotar  un  Fórmula  1,  aunque  esto  último  sea  mu- 
cho más  excitante).  Ha  de  entenderse  todo  lo  que  sigue  como  una  serie 
de  resultados  que  enriquecen  el  conocimiento  de  los  procesos  normales: 
las  funciones  varias  veces  derivables  son  las  “normales”  , sus  gráficas 
representan  procesos  “normales” , y por  eso  conocer  su  comportamiento 
es  útil. 

Definición  19.  Si  una  función  / : X — > M es  derivable  en  todos 
los  puntos  de  su  dominio,  entonces  se  denomina  función  derivada  de 
/,  f a la  función  que  en  cada  punto  x de  X vale  f'(x). 

6.1.  Propiedades  aritméticas  de  la  derivada.  Las  propieda- 
des básicas  de  la  derivada  se  deducen  muy  fácilmente  utilizando  razo- 
namientos con  cantidades  infinitamente  pequeñas.  Antes  de  nada: 

Lema  5.  Si  f(x)  = c en  un  intervalo  ( a,b ),  entonces  f'(x)  = 0.  Si 
f(x)  = x en  un  intervalo  ( a,b ),  entonces  f'(x)  = 1.  Es  decir,  (c)'  = 0 

y (x)'  = i. 

Demostración.  La  derivada  es  (si  existe)  el  límite  de: 

f(x  + h)~  f(x) 
h 

en  el  primer  caso,  f(x)  = c siempre,  así  que  queda 

c — c 0 
~h~  = h 


0. 
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En  el  segundo  caso,  f(x)  = x,  así  que 

x + h — x h 
h = h 


□ 


De  la  misma  manera  se  deducen  las  siguientes  propiedades  (supo- 
niendo que  / y g son  funciones  derivables  en  un  punto  x,  etc. . . 

Suma:  (/  + g)'(x)  = f'(x)  + g'(x). 

Producto:  (/  • g)'(x)  = f(x)g(x)  + f(x)g'(x). 

Inversa:  Si  / : (a,  b)  — > (c,  d)  es  biyectiva  y f{x)  ^ 0 y /_1  : 

(c,  d)  — > (a,  b)  es  su  inversa,  entonces  /_1(/(a;))  = jT^yy- 
División:  Si  g(x)  ^ 0,  entonces 

f ¿\\x)  = ~ fWdW 

\g)  g(x)2 

Potenciación:  (xp)'  = rxp~l , para  n G Q (fácil  hacerlo  para 
p E N,  usar  la  función  inversa  para  1/py  usar  otra  vez  la  de  N 
para  p/q). 

Composición:  o regla  de  la  cadena : (f(g(x))'  = g'(x)f'(g(x)). 

Vamos  a demostrar  solo  unas  de  ellas. 

Para  la  división,  se  tiene  la  siguiente  cadena  de  igualdades 

j(x  + h)  - ¿(x)  _ g(x)f(x  + h)  - g(x  + h)f(x)  = 
h g(x  + h)g(x)h 

g(x)(f(x)  + f'(x)h  + di (h)h)  - f{x){g(x)  + g'(x)h  + d2{h)h)  h = 
g{x)(g(x)  + g'(x)h  + d3(h))h 
f{x)g(x) d + g(x)M1(h)  - f(x)g\x)h  - f(x)hd2(h)  = 
(g(x)2  + g'(x)h  + d3(h))h 

(g(x)f(x)  - f(x)g'(x)  + d 3(h))h  _ g(x)f(x)  - f(x)g'(x) 

(g(x)2  + Mh))h  g{x)2  + 51  J 

donde  todos  los  d*  son  infinitésimos.  De  aquí  se  deduce  el  resultado 
enunciado  (hemos  hecho  uso  de  una  igualdad  l/(a+d(/i))  = 1 / a+di(h) , 
que  es  sencilla  y se  ha  de  conocer. 

Para  la  regla  de  la  cadena : 


f(g{x  + h))  - f(g(x)) 
h 

f{g{x)  + g'(x)h  + di (h)h)  - f(g(x)) 
h 

f(g(x))  + f'{g{x))sf{x)h  + d1(h)d2{h)h  - f(g(x)) 


h 

g\x)f\g{x))h  + d 2(h)h 
h 


= g'{x)f'{g{x ))  + d3(h) 
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donde  todos  los  d¿  son  infinitésimos.  De  esta  cadena  de  igualdades  se 
deduce  la  regla  de  la  cadena. 

De  aquí  se  deduce  muy  fácilmente  el  cálculo  de  la  derivada  de  un 
polinomio,  por  ejemplo. 

6.2.  Derivadas  de  las  funciones  “típicas”.  ¿Cómo  se  calcu- 
lan las  derivadas  del  seno  y del  coseno?  En  realidad,  esta  pregunta  es 
errónea:  la  función  seno  y la  función  coseno  se  definen  precisamente  en 
función  de  sus  derivadas. 


FIGURA  16.  El  seno  y el  coseno  de  a:  la  circunferencia 
unidad  se  recorre  como  (sen(a),  cos(a))  a velocidad  1, 
así  que  el  vector  velocidad  es  (—  cos(a),  sen(a)),  pues  es 
perpendicular  al  radio. 

La  Figura  16  muestra  gráficamente  la  definición  de  las  funciones 
seno  y coseno:  son  las  que  parametrizan  la  circunferencia  de  radio  1, 
de  manera  que  a un  ángulo  a se  le  asigna  (sen(a),  cos(a))  de  modo 
que  el  vector  velocidad  de  dicha  trayectoria  tenga  también  módulo  1 
y,  al  ser  perpendicular  al  radio  (esto  es  un  principio  físico),  ha  de  ser 
(—  cos(a), sen(a)).  Pero  el  vector  velocidad  (y  esto  es  otro  principio 
físico)  se  calcula  derivando  coordenada  a coordenada,  así  que  al  final 
nos  queda  que 

sen(x)'  = cos(x),  cos(x)/  = — sen(x), 
que  sabíais  hace  ya  tiempo. 

La  derivada  de  la  función  exponencial  es  todavía  más  sencilla,  pues 
la  función  exponencial  se  define  como  la  única  cuya  derivada  es  ella 
misma: 

(, ex)'  = ex,  con  e°  = 1. 
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De  aquí  sale  la  derivada  del  logaritmo.  Como  sabemos  que  log(ea;)  = x, 
tiene  que  ser 

(e*)'(log(e*))'  = 1, 

de  donde,  como  la  derivada  de  la  exponencial  es  la  exponencial, 

(logfe1))'  = i. 

ex 

es  decir,  que  para  todo  número  x > 0, 

(logia:))'  = -• 

x 

6.3.  La  derivada  logarítmica.  No  voy  a insistir  en  esto,  pero 
por  la  regla  de  la  cadena 

<‘°g  ('(*>»'  = 7$ 

Así  que  si  f(x)  es  difícil  de  derivar , puede  que  sea  más  fácil  derivar  su 
logaritmo.  Por  ejemplo: 


Tomando  logaritmos,  queda 

(log(a:a;))/  = (xlog(x))/  = log(x)  + 1 
y,  por  la  regla  de  la  cadena,  es 

(log(x*))'  = ^1, 

Xx 

por  lo  tanto 

(. xx )'  = a;x(log(a;)  + 1). 

6.4.  La  recta  tangente.  El  cálculo  de  los  parámetros  de  la  ecua- 
ción (1)  (la  de  la  “recta  tangente”  en  (a,  /(a))  a la  gráfica  de  /)  era 
uno  de  los  objetivos  a la  hora  de  estudiar  la  derivada  de  una  función  de 
variable  real.  De  todos  los  argumentos  previos,  se  deduce  que,  si  / es 
derivable  en  a,  entonces  la  recta  tangente  a la  gráfica  de  / en  el  punto 
(a,  f(a))  es: 

V = f'(a)(x  -a)  + /(a), 

que  es  una  expresión  que  hay  que  saberse  de  memoria.  Bueno,  realmente 
no  hace  falta  saber  nada  de  memoria:  la  recta  tangente 

■ Tiene  pendiente  /'(a ) (esta  es  la  definición  de  derivada). 

■ Pasa  por  el  punto  (a,  /(a))  (pues  es  tangente  a la  gráfica). 

Estas  dos  condiciones  solo  las  cumple  una  recta. . . y esta  hay  que  saber 
escribirla. 
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6.5.  Órdenes  de  magnitud  I.  Regla  de  L’Hópital.  Los  órde- 
nes de  magnitud  de  dos  funciones  se  comparan  dividiéndolas  (no  restán- 
dolas). Si  f{x)/g{x ) es  mayor  que  uno  desde  un  momento  en  adelante 
(o  cerca  de  un  punto),  sabemos  que  / tiene  un  orden  de  magnitud  al 
menos  como  el  de  g.  Si  es  cero,  es  que  / es  mucho  más  pequeña  que  g. 
A partir  de  ahora  vamos  a comparar  funciones  “que  se  acercan  a cero” 
en  un  punto  a,  no  necesariamente  los  infinitésimos  del  tipo  d(ú),  que 
son  los  que  hemos  usado  hasta  ahora.  La  noción  es  esencialmente  la 
misma. 

Definición  20.  Sea  a e M U {— oo,  +oo}  un  número  real  o infinito 
y sea  / una  función  definida  en  un  entorno  de  a.  Se  dice  que  / es  un 
infinitésimo  en  a si  límx^a  f(x)  = 0. 

Es  evidente  que  la  suma,  resta  y producto  de  infinitésimos  es  un 
infinitésimo.  También  el  producto  de  un  infinitésimo  por  un  número  e 
incluso  por  una  función  acotada  en  un  entorno  de  a. 

Para  comparar  el  orden  de  dos  infinitésimos  se  utiliza  el  cociente: 

Definición  21.  Sean  f y g dos  infinitésimos  en  o y llámese  l a 
l = límx_»a  que  se  supone  que  existe  (o  es  ±oo).  Se  dice  que: 

■ / y g son  equivalentes  si  / = 1.  Se  escribe  / = g. 

■ / y g son  del  mismo  orden  si  l £ M y l ^ 0, 1. 

■ / es  de  orden  superior  a g si  / = 0.  Se  escribe  / = o(g). 

■ g es  de  orden  superior  a / si  / = ±oo.  Se  escribe  g = o(/). 

Con  los  infinitos  se  tiene  una  colección  análoga  de  términos 

Definición  22.  Sea  a e M U {— oo,  +00 } un  número  real  o ±00 
y sea  / una  función  definida  en  un  entorno  de  a.  Se  dice  que  / es  un 
infinito  en  a si  límx^a  ffx ) = ±00. 

A diferencia  de  los  infinitésimos,  con  los  infinitos  solo  se  puede  ase- 
gurar que  el  producto  de  un  infinito  por  otro  es  un  infinito  y que  el 
producto  de  un  infinito  por  una  función  cuya  inversa  está  acotada  cerca 
de  a es  un  infinito  (es  decir,  el  producto  por  una  función  g(x)  que  tal 
que  \g(x)\  > M para  cierto  M en  un  entorno  de  a). 

Los  infinitos  también  se  comparan: 

Definición  23.  Sean  f y g dos  infinitos  en  a.  Sea  l = límx^a 
que  se  supone  que  existe  (o  es  ±00.  Se  dice  que: 

• f y g son  equivalentes  si  / = 1.  Se  escribe  / = g. 

• f y g son  del  mismo  orden  si  l G M y l 7^  0, 1. 

■ / es  de  orden  superior  a g si  / = ±00.  Se  escribe  / = O(g). 

■ g es  de  orden  superior  a / si  / = 0.  Se  escribe  g = O(f). 

Nota  1.  Esta  notación,  como  la  de  la  o,  no  es  universal.  Hemos 
utilizado,  para  conveniencia  del  alumno,  la  misma  que  en  el  libro  de 
los  profesores  de  la  asignatura  en  el  curso  2011/2012. 
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Está  claro  que  habrá  problemas  a la  hora  de  calcular  estos  límites, 
pues  aparecerán  siempre  indeterminaciones  del  tipo  o Se  utili- 
zará muchas  veces  la  Regla  de  Lópital: 


Teorema  5 (Regla  de  Lópital).  Sea  a e MU{— oo,  +oo}  un  número 
real  o infinito.  Sean  f(x ) y g(x)  dos  funciones  definidas  en  un  entorno 
de  a y que  son  ambas  infinitésimos  o ambas  infinitos  en  a.  Supongamos 
que  el  siguiente  límite  existe: 

f'(x) 

lím  — — - = / G M U {— oo,  +cx)}. 
x^a  g\x) 


E7itonces  el  límite 


también  existe  y vale  l. 


lím 

x—>a 


f(x) 

g{x) 


Nota  2.  Nótese  — y esto  es  muy  importante — la  dirección  de  la 
implicación:  si  existe  el  límite  del  cociente  de  derivadas,  existe  el  del 
cociente  de  funciones  y no  necesariamente  al  revés. 


Ejemplo  1.  Sean  f(x)  = x + sen(x),  g(x) 
vamente  sencillo  probar  que 


lím 

JE— KX> 


f(x) 

g(x) 


1. 


x + cos(x).  Es  relati- 


Sin  embargo,  f(x)  = l + cos(x),  g'(x)  = 1 — sen(x).  Estas  dos  funciones 
se  hacen  0 en  puntos  distintos  una  infinidad  de  veces,  así  que  el  límite 
en  infinito  de  f'(x)/g'(x)  no  existe. 


6.6.  Los  teoremas  esenciales.  Los  problemas  ingenieriles  y físi- 
cos pueden  ser,  como  ya  dijimos,  de  varios  tipos.  Los  dos  básicos  son: 

■ Resolver  una  ecuación  (¿cuánto  tiempo  se  tarda  en  esto?). 

■ Optimizar  un  proceso  (¿cuál  es  la  manera  más  rápida  de  hacer 
algo?). 

El  Teorema  de  Bolzano  (Teorema  2)  da  una  idea  de  que  el  primer 
tipo  de  problemas  tiene  solución  si  se  conoce  algo  de  información  de 
la  ecuación.  De  hecho,  una  manera  burda  pero  funcional  de  resolver 
ecuaciones  de  manera  aproximada  es  precisamente  con  la  demostración 
clásica  de  dicho  teorema  por  bipartición  (esto  lo  estudiaréis  en  Métodos 
Numéricos). 

Los  problemas  de  optimización  son  por  lo  general  muy  complicados. 
Buscar  máximos  y mínimos  puede  ser  una  tarea  difícil,  tediosa  y pesa- 
da. Hay  múltiples  algoritmos  para  localizar  máximos  y mínimos,  pero 
todos  ellos  parten  de  un  resultado  gráfico  básico:  si  una  función  f(x) 
no  tiene  esquinas  y a es,  localmente  un  máximo  o un  mínimo,  entonces 
la  gráfica  de  / es  horizontal  en  (a,  /(a)).  Las  rectas  horizontales  tienen 
por  ecuación  y = cte. 
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Definición  24.  Se  dice  que  a es  un  extremo  local  o relativo  de  una 
función  / si  existe  un  intervalo  / = (a  — 5,  a + 5)  en  el  que  /(a)  > f{x) 
para  todo  x de  / o bien  /(a)  < f(x)  para  todo  x de  I.  En  el  primer 
caso  a es  un  máximo  local  y en  el  segundo  un  mínimo  local.  Si  la 
desigualdad  es  /(a)  > f(x)  para  x ^ a,  se  habla  de  máximo  local 
estricto  (y  lo  análogo  para  el  mínimo). 

Nótese  el  adjetivo  local:  los  extremos  locales  son  extremos  cerca  de 
ellos,  no  necesariamente  para  toda  la  función: 


Figura  17.  Extremos  locales  (rojo)  y globales  (verde) 
— los  extremos  globales  también  son  locales,  claro. 


El  resultado  que  acabamos  de  enunciar  antes  de  la  definición  es  el 
siguiente 


Lema  6.  Si  f : (a,  b)  — > M.  es  derivable  en  c e (a,  b)  y tiene  un 
extremo  local  en  c,  entonces  f'(c ) = 0. 


Demostración.  No  hay  más  que  ver  la  figura  17.  Supongamos 
que  / tiene  un  máximo  en  c.  Entonces 


f(c  + h)  = /(c)  - d (h) 


donde  d(/i)  es  un  infinitésimo  positivo , independientemente  de  h.  Como 
sabemos  que  es  derivable,  sabemos  también  que 


Es  decir, 


f(c  + h)  - /(c) 
h 


f(c)  + di(h) 


f(c  + h)  - f(c)  = (f(c)  + di  (h))h  = f\c)h  + hdi(h). 


Como  hdi(h)  es  mucho  más  pequeño  que  h,  para  que  f(c  + h)  — f{c) 
tenga  signo  negativo  independientemente  de  h , solo  puede  ser  /'(c ) = 
0 en  el  último  miembro  (si  f{c ) > 0 entonces  f\c)h  + hd\(h)  sería 
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positivo  cerca  de  h — 0,  y si  f'(c)  < 0 entonces  sería  negativo).  Por 
tanto,  tiene  que  ser 

f(c)  = 0. 

□ 

El  razonamiento  es  correcto,  aunque  no  estéis  acostumbrados  a pen- 
sar así.  Insisto:  así  piensan  los  físicos,  no  con  épsilons  y deltas  sino  con 
“cantidades  infinitamente  pequeñas” , y así  se  hizo  el  cálculo  infinitesi- 
mal. 

Nótese  que  el  teorema  enuncia  una  condición  necesaria , pero  no 
suficiente:  hay  puntos  en  los  que  la  derivada  puede  ser  0 pero  que  no 
son  extremos  locales  (ni  globales). 


Figura  18.  Un  punto  con  derivada  nula  no  extremo. 

Del  Teorema  de  Weierstrass  (4)  y de  esta  condición  se  deduce  muy 
fácilmente  el  siguiente: 

Teorema  6 (Teorema  de  Rolle).  Si  f : [a,b]  — > M.  es  continua  y es 
derivable  en  ( a,b ) y f(a ) = f{b)  entonces  hay  un  punto  c G (a,  b)  tal 
que  f(c)  = 0. 

Este  resultado  es  la  base  del  más  importante  de  todo  el  Cálculo. 
Gráficamente  quiere  decir  que  si  uno  dibuja  una  función  derivable  (y 
por  tanto  continua)  que  vale  lo  mismo  en  los  dos  extremos  de  un  in- 
tervalo, entonces  la  gráfica  se  hace  horizontal  en  algún  momento.  Esto 
debería  ser  obvio.  No  por  ello  es  trivial : este  resultado  es  — llevado  al 
extremo,  que  llamaremos  el  Teorema  del  Valor  Medio — tan  importante 
como  el  Polinomio  de  Taylor,  que  es  lo  más  importante  del  Cálculo. 

Prueba  del  Teorema  de  Rolle.  La  prueba  es  muy  sencilla; 
hay  dos  posibilidades:  o bien  f(x ) = /(a)  = f(b ) en  todos  los  pun- 
tos de  [a,  b\,  o bien  no  es  así.  En  el  primer  caso,  la  función  es  constante 
y su  derivada  es  0 en  todos  los  puntos  de  (a,  b ).  Fin.  En  el  segundo  caso, 
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por  el  Teorema  de  Weierstrass  4,  la  función  tiene  o bien  un  mínimo  o 
bien  un  máximo  en  el  interior:  hay  un  punto  c G (a,b)  tal  que  /(c)  es 
un  extremo  de  / (y  por  tanto,  es  un  extremo  local , por  ser  c del  interior 
(a,  b )).  Acabamos  de  probar  en  el  Lema  6 que  f'(c ) = 0.  □ 

Téngase  en  cuenta  que  puede  haber  solo  un  extremo  local,  no  tiene 
por  que  haber  un  máximo  y un  mínimo  locales  en  (a,  b ) (piénsese  en 
f(x)  = x 2 definida  en  [—1, 1],  por  ejemplo). 


Figura  19.  Puntos  con  derivada  0 (Teorema  de  Rolle) 

6.7.  El  Teorema  del  Valor  Medio.  Del  Teorema  de  Rolle  se 

deduce,  con  un  truco  clásico  (una  trampa  sintáctica,  vamos  a decir, 
porque  hay  que  llamar  a las  cosas  por  su  nombre),  el  Teorema  del 
Valor  Medio.  Tiene  varios  enunciados.  Primero  damos  el  clásico,  con 
la  condición  de  igualdad.  Es  lo  mismo  que  el  Teorema  de  Rolle  pero 
“inclinando  la  gráfica”.  Gráficamente:  si  una  función  es  continua  en 
[a,b]  y derivable  en  (a,  b),  entonces  hay  un  punto  c G (a,  b)  en  que 
la  derivada  es  paralela  a la  recta  que  pasa  por  los  puntos  (a,  /(a))  y 

(b,f(b)). 

Teorema  7.  Sea  f : [a,  b]  — > M una  función  continua  que  es  deri- 
vable en  (a,  b).  Existe  al  menos  un  punto  c G (a,  b)  en  el  que  la  derivada 
f'(c)  vale  la  pendiente  del  segmento  que  une  (a, /(a))  y (6,  /(&)): 

//(c)  = f(b)  — f (a) ' 
b — a 

Demostración.  La  prueba  que  sigue  es  un  razonamiento  geométri- 
co clásico.  Queremos  convertir  este  enunciado  en  el  del  Teorema  de 
Rolle  (gráficamente  es  lo  mismo  salvo  que  en  Rolle,  la  recta  es  “hori- 
zontal”) y en  este  buscamos  un  punto  en  que  la  tangente  sea  paralela 
a la  recta  que  une  los  extremos  de  la  gráfica  de  /.  Tendríamos  que 
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FIGURA  20.  Teorema  del  Valor  Medio.  En  este  ejemplo 
hay  dos  puntos  con  tangente  paralela  a la  recta  que  une 
los  extremos.  El  teorema  dice  que  al  menos  hay  uno. 


“llevar”  f(b)  a la  altura  de  /(a),  sin  tocar  /(a).  Nada  más  fácil.  Vamos 
a definir  una  nueva  función  g que  vale  lo  mismo  que  / en  a y tiene  una 
gráfica  similar  salvo  que  hacemos  que  g(b)  sea  /(a).  Con  un  poco  de 
esfuerzo. . . 

g(x)  = f(x)  -(x-  a)^j- — — 

b — a 

¿qué  significa  eso?  Por  un  lado,  si  queremos  que  g(x)  se  parezca  a 
f(x),  empezamos  haciendo  que  sea  igual : g{x)  = f(x).  Pero  queremos 
deformarla  un  poco  pero  de  tal  manera  que  en  a,  se  mantenga  el  valor: 
g(a)  = /(a).  Esto  es  muy  fácil,  deformar  significa  sumar  (o  restar)  algo. 
Pues  restamos  (se  piensa  más  fácil  restando): 

g(x)  = f(x)  - ■ 

importante:  queremos  que  lo  que  restamos  no  toque  el  hecho  de  que 
g(a)  = /(a),  para  ello  nos  aseguramos  haciendo  que  ese  resto  valga  0 
en  a:  pues  multiplicamos  por  (x  — a): 

g(x)  = f(x)  - {x  - a)  ■ ■ ■ ■ 

Ahora  ya  se  cumple,  hagamos  lo  que  hagamos  al  multiplicar,  que  g(a)  = 
/(a).  ¿Podemos  conseguir  añadir  un  factor  y que  quede  g(b)  = f(a ) 
también?  Aquí  es  donde  la  experiencia  vale  muchos  puntos.  ¿Cuánto 
vale  ( x — a ) en  bl  Pues  b — a.  Para  empezar,  queremos  quitar  este  ( b — a ) 
del  problema:  dividimos.  Por  tanto  buscamos  una  expresión  como 

* 


g(x)  = f(x)  - {x  - a) 


b — a 
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donde  solo  nos  queda  buscar  el  valor  de  a.  Tal  como  está  la  cosa,  ¿cuánto 
vale  ahora  g(b)7: 

9(!>)=m-{b-a)1-L-  =/(&)-* 

b — a 

y queremos  que  g(b)  sea  /(a).  Es  decir, 

f(a)=m~* 


Así  que  a = f(b)  — f(a).  De  donde  sale  la  expresión  de  g(x).  Está  claro 
que  g(x)  cumple  las  condiciones  del  Teorema  de  Rolle,  así  que  hay  un 
punto  c G (a,  b)  en  el  que  la  derivada  g\c)  es  0.  Pero. ..  ¿Cuál  es  la 
derivada  de  <7? : 


g'  (x)  = f'(x) 


m - m 

b — a 


y como  g'(c ) = 0,  queda 


no  - hhvM, 

b — a 

que  es  la  pendiente  de  la  recta  que  pasa  por  (a,  /(a))  y (6,  /(&)).  □ 


El  Teorema  del  Valor  Medio  parece  que  es  un  Teorema  de  igualdad 
(de  hecho,  tal  como  está  enunciado,  es  una  igualdad):  existe  un  punto 
en  que  la  tangente  a la  gráfica  es  paralela  a la  recta  que  une  los  ex- 
tremos. Sin  embargo,  en  la  vida  real  se  utiliza  como  un  resultado  de 
acotación,  porque  “se  mira  al  revés” . 


Figura  21.  Teorema  del  Valor  Medio  como  desigual- 
dad. La  pendiente  más  inclinada  pone  límites  a los  posi- 
bles valores  de  la  función. 

Observemos  la  Figura  21:  la  función  (que  es  continua  y derivable 
en  el  intervalo  correspondiente)  tiene  un  punto  c (en  rojo)  en  que  la 
derivada  es  máxima  (la  curva  tiene  la  mayor  pendiente  ahí).  Por  el  Teo- 
rema del  Valor  Medio,  si  / tomara  algún  valor  en  la  zona  gris  superior, 
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digamos  (aq,  f(x  i)),  habría  un  punto  co  entre  ay  xo  en  que  la  derivada 
valdría 

f'M  = 

Xq  — a 

pero  eso  quiere  decir  que  la  recta  tangente  a la  gráfica  de  / en  ese  punto 
sería  más  pendiente  que  la  recta  roja  punteada,  y hemos  dicho  que  esa 
es  “la  mayor  pendiente”  de  /.  Por  un  razonamiento  análogo,  la  gráfica 
de  / no  puede  pasar  por  la  zona  gris  inferior.  En  resumen,  el  Teorema 
del  Valor  Medio  nos  dice  que 

Si  podemos  acotar  la  derivada  de  / en  un  intervalo,  podemos 
acotar  el  incremento  de  / en  ese  intervalo. 

Lo  cual  no  es  nada  nuevo : si  sabemos  que  Fernando  Alonso  ha  ido  como 
mucho  a 300 km/h  durante  un  minuto,  es  obvio  que  podemos  acotar  el 
espacio  que  ha  recorrido:  como  mucho  300km/h  ■ 1/60 h = 5 km.  Si 
sabemos  que  una  barra  de  1 m de  un  material  desconocido  tiene  al 
menos  una  densidad  lineal  de  2,75 kg/m,  entonces  la  barra  al  menos 
pesa  1 m • 2,75 kg/m  = 2,75 kg. 

El  Teorema  del  Valor  Medio  como  desigualdad  no  es  más  que  una 
manera  abstracta  de  enunciar  esto. 


Teorema  8 (del  Valor  Medio  como  desigualdad) . Supongamos  que 
f : [a,b\  — > M es  continua  en  [ a,b ] y es  derivable  en  ( a,b ).  Si  existen 
números  reales  m,  M e M tales  que  m < f'[x)  < M en  todo  ( a,b ) 
entonces 

m(b  — a)  < f(b ) — f(a)  < M(b  — a), 

O,  lo  que  es  lo  mismo: 

fCb ) — fía ) 

m < < M. 

b — a 

Es  decir,  acotar  la  derivada  lleva  a acotar  el  incremento  de  la  función. 


En  castellano:  si  un  motor  rota  entre  200 rpm  y 4500rpm  y sabemos 
que  está  encendido  durante  23s,  acótense  las  vueltas  que  puede  haber 
dado.  Fácil:  como  poco  200rpm-23/60m  = 76,66 vueltas  y como  mucho 
1725 vueltas.  Como  todo  el  mundo  sabe,  las  revoluciones  por  minuto 
son  una  derivada  (en  este  caso,  una  derivada  angular,  pero  derivada). 

Este  teorema  nos  servirá  más  adelante  para. . . ¿cómo  no?  acotar 
integrales,  claro. 


6.8.  Derivada  de  derivada  etc. . . Si  f'{x)  es  la  derivada  de 
una  función  / : M — » M,  se  la  puede  considerar  también  como  una  fun- 
ción real  de  variable  real,  que  puede  a su  vez  ser  derivable.  La  derivada 
da  f'(x)  se  llama  derivada  segunda  de  f y se  denota  f"{x). 

Y así  sucesivamente,  se  definen  la  derivada  tercera,  la  cuarta,  la 
quinta,  etc.  La  “general”  se  llama  derivada  n—ésima.  A partir  de  n = 3, 
se  suele  indicar  la  derivada  n—ésima  con  el  número  entre  paréntesis  (a 
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veces  solo  con  el  paréntesis  cerrado),  en  lugar  de  una  lista  de  comitas: 

6.8.1.  Ejemplos.  Calculemos  algunas  derivadas  n— ésimas. 

■ La  derivada  n— ésima  de  la  función  exponencial  ex  es,  fácilmen- 
te, ex,  pues  sabemos  que  ( ex )'  = ex,  de  manera  que  siempre  sale 
lo  mismo. 

■ La  derivada  n— ésima  de  la  función  xm  (donde  m es,  de  mo- 
mento, un  número  entero)  se  calcula  poco  a poco.  La  primera 
derivada  es: 

(. xm)'  = mxm-\ 

“bajar  el  exponente  y restarle  uno”.  Si  se  deriva  otra  vez,  el 
exponente  ahora  es  uno  menos  y hay  que  restarle  otro.  Por 
tanto,  si  se  deriva  n veces,  hay  que  multiplicar  por  m(m  — 
1) . . . (m  — n+1)  (cuidado  con  el  +1),  mientras  que  el  exponente 
será  m — n.  Así  que 

(xm)(n)  = m(m  — 1 ) ...  (m  — n + l)xm~n. 

No  hay  que  preocuparse  de  que  n > m pues  en  ese  caso  el 
coeficiente  se  hace  cero  y queda  derivada  n— ésima  cero,  como 
debe  ser. 

■ La  derivada  n— ésima  del  logaritmo  es  un  poquito  más  compleja. 

Se  sabe  que  (log(x))/  — — x~l ■ Ahora  se  utiliza  la  derivada 

n — 1— ésima  que  hemos  calculado  antes  y ya  está: 

(re-1)1”"11  = ( — 1)( — 2) ...  (-1  - (n  - l))!-1-'”-1’, 
por  tanto, 


(Iog(x))W  = (-l)(-2)...(-n)-. 
Haremos  más  ejercicios,  supongo. 


x" 


6.9.  Derivada  de  funciones  implícitas.  A veces  una  función 
viene  definida  de  manera  implícita,  en  lugar  de  “explícitamente”.  Un 
ejemplo  bien  conocido  es  1a.  función  que  define  1a.  circunferencia  de  radio 
r centrada  en  (0,0): 

2,2  2 
x + y — r . 

La  “gráfica”  de  esta  función  define,  si  se  considera  solo  la  parte  “por 
encima  del  eje  de  las  x” , una  función  y(x),  de  manera  impícita.  Pasando 
todos  los  términos  al  miembro  de  la.  izquierda,  queda  una  igualdad  a 0: 

x + y — r = 0. 

Un  problema  que  puede  surgir  es  el  de  calcular  la  recta  tangente  a dicha 
curva,  implícita  en  un  punto  ( x , y(x))  — por  ejemplo,  en  p = (r^,  r^). 
¿Puede  hacerse  esto  sin  despejar?  Sí,  utilizando  la  regla,  de  la  cadena. 
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Como  sabemos  que  y es  una  función  de  x (aunque  no  conozcamos  su 
valor),  podemos  escribir 

x 2 + y(x)2  — r2  = 0 

y ahora,  como  la  derivada  de  una  constante  es  cero,  si  derivamos  el 
miembro  de  la  izquierda,  debe  dar  cero.  Usando  la  regla  de  la  cadena: 

2x  + 2 y{x)y'{x)  = 0 

De  donde 


y,  en  el  punto  p se  tiene,  por  tanto 


(lo  cual  es  conocido:  en  ese  punto  la  recta  tangente  a la  circunferencia 
está  inclinada  45  grados  hacia  abajo). 

En  general,  siempre  se  calcula  así.  De  hecho,  puede  también  calcu- 
larse la  derivada  segunda,  la  tercera,  etc. . . Siempre  y cuando  se  cum- 
plan unas  condiciones  mínimas  que  no  vamos  a explicar.  A esto  se  le 
llama  “derivación  implícita” . Cuando  conozcamos  el  polinomio  de  Tay- 
lor,  veremos  que  puede  ser  útil  si  se  conoce  una  expresión  implícita  de 
una  función,  aunque  no  pueda  despejarse.  Haremos  ejercicios  de  esto, 
pero  no  mucho  más. 


7.  Taylor 

La  derivada,  como  se  dice  siempre,  es  la  pendiente  de  la  recta  tan- 
gente a la  gráfica  de  una  curva.  Dicho  de  otro  modo,  es  la  pendiente 
de  la  recta  que  mejor  aproxima  a una  función  en  un  punto.  Es  decir,  si 

y = k(x  - a)  + f (a) 

es  la  ecuación  de  una  recta  que  pasa  por  (a,  /(a)),  entonces  esa  recta 
es  la  tangente  a la  gráfica  de  / si  y solo  si  k = f(a)  (asumiendo  que  / 
es  derivadle  en  a,  etc.). 

Cabe  preguntarse  por  las  aproximaciones  de  segundo  orden:  ¿cuál 
es  la  curva  de  grado  2 que  mejor  aproxima  a / cerca  de  a?  Escribamos 
la  ecuación  de  un  polinomio  de  grado  2 que  pase  por  (a,  / (a)): 

y = k2(x  — a)2  + ki(x  — a)  + /(a) 

Queremos  calcular  k\  y /c2  de  manera  que  ese  polinomio  aproxime 
lo  mejor  posible  a / cerca  de  a.  Es  decir,  queremos  (imitando  el  caso 
de  la  derivada)  que 

(2)  /(a  + (x  — a))  = /(a)  + k\ {x  — a)  + /^(x  — a)2  + (x  — a)2d(x  — a) 
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donde  d(x  — a)  es  un  infinitésimo  en  a.  Llamando  x — a = h,  se  puede 
poner  {x  — a)2  ~ h2d(h)  con  lo  que  queda 

/(o  + h ) = k\h  + /(a)  + h2di(h) 

es  decir,  k\  = f'(a).  Una  vez  calculado  k\ , derivando  la  expresión  (2), 
queda 

f(a  + h)  = 2k2h  + f(a)  + hd2(h) 
pero  si  f es  derivadle,  esto  no  significa  más  que  k2  = 

Si  en  lugar  de  la  aproximación  de  grado  2 usamos  la  de  grado  n, 
conseguimos  un  resultado  análogo.  Supongamos  que  f(x)  es  derivadle 
n veces  y queremos  aproximarla  por  un  polinomio  de  grado  n 

y = an(x  — a)n  + an-i(x  — a)n_1  + • • • + ai(x  — a ) + ao- 
Llamando  (x  — a)  — h,  queda  que 

/(a  + h)  = ao  + a\h  + hd\{h) 

(para  di(/i)  infinitesimal),  de  modo  que  ao  = /(a)  y ai  = f'(a).  Sadido 
esto,  derivando  sucesivamente  se  llega,  tras  n derivaciones,  a que 

f(n\a  + h)  = /(n_1)(a)  + (i n)\anh  + hdn(h) 

para  d n(h)  ifninitesimal,  de  donde  se  deduce  que  los  coeficientes  a.¿  son 

a0  = f (a) , d\  = /'(a),a2  = ^/"(a), . . . ,a„_ x /(n_1)(a), 

2 [n  — 1)! 

an  = -J{n\a). 
ni 

Así  que,  al  final  queda,  poniendo  (x  — a)  en  lugar  de  h 

f(a  + {x  - a))  = f(a)  + f{á)(x  - a)  + ^f'{a)(x  - a)2  H h 

+ • • • + ^ f{n\a)(x  - a)n  + dn(x  - a)n 
ni 

con  dxn(x  — a)  un  infinitésimo. 

De  hecho,  es  posible  acotar  el  error  que  se  produce  si  se  conoce  algo 
sobre  /^n+1^(a),  como  en  el  Teorema  del  Valor  Medio.  Pero  vamos  por 
partes. 


Teorema  9 (Polinomio  de  Taylor).  Sea  f : (a  — e,  a + e)  > M 
una  función  n veces  derivable  en  a.  Existe  un  polinomio  P{x)  = a0  + 
ai(x  — a)  + ■ ■ ■ + an(x  — a)n  tal  que 


lím 

x—*a 


f(x)  - P(x) 
(x  — a)n 


0. 


De  hecho,  los  coeficientes  de  P(x)  son  ao  = /(a),  a¿  = f^\a)/i\  para 
i — 1, ...  ,n. 


A Pn  se  le  llama  polinomio  de  Taylor  de  orden  n de  f en  a. 

El  siguiente  resultado  es  de  examen,  no  se  puede  decir  más  claro. 
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Teorema  10  (Primera  cota  del  error) . Supongamos  que  f es  deri- 
vable  7i+l  veces  en  (a  — e,  a + e)  y que  Pn  es  su  polinomio  de  Taylor 
de  orden  n en  a.  Si  |/^n+1^(a;)|  < M en  todos  los  puntos  del  intervalo 
(a  — e,  a + e) . Entonces 

I f(x)  ~ P(x)  | < + M\x  - a\n+1 

en  dicho  intervalo. 

La  prueba  “formal  newtoniana”  de  ambos  resultados  se  hace  por 
inducción  (un  método  que  para  este  caso  es  muy  poco  intuitivo).  La 
prueba  que  hemos  esbozado  arriba  es  perfecta  para  la  construcción  del 
Polinomio  de  Taylor  y,  una  vez  construido,  basta  aplicar  el  Teorema 
del  Valor  Medio  como  cota  para  obtener  el  segundo. 

7.1.  Derivada  implícita  y Polinomio  de  Taylor.  Quizás  ha- 
gamos algún  ejercicio  sobre  esto,  pero  depende  del  tiempo.  Véase  la 
sección  6.9  y repásense  los  detalles. 

8.  Propiedades  dinámicas  de  las  funciones 

Hasta  aquí  hemos  hecho  estudios  más  bien  teóricos  de  las  funciones, 
aunque  hemos  también  obtenido  resultados  muy  interesantes  Vamos 
ahora  a estudiar  las  propiedades  clásicas  de  las  funciones,  esencialmen- 
te todo  lo  relacionado  con  su  dinámica  (que  es  lo  que  se  ve  en  la  gráfi- 
ca). En  cierto  modo  podríamos  titular  esta  sección  representación  de 
funciones,  pero  es  mejor  entender  todo  este  trabajo  como  propiedades 
dinámicas. 

8.1.  Puntos  de  corte.  Lo  primero  que  interesa  de  una  función 
/ real  de  variable  real  son  los  puntos  de  corte  con  los  ejes: 

■ Los  puntos  de  corte  con  el  eje  OX  son  las  raíces  (soluciones)  de 
la  ecuación  f(x)  = 0. 

■ El  (solo  debería  haber  uno)  punto  de  corte  de  / con  el  eje  O Y 
es  el  punto  (0,  /(O)). 

Una  función  no  puede  tener  más  de  un  punto  de  corte  con  el  eje 
OY  (¿por  qué?). 

8.2.  Extremos  relativos.  Recordemos  la  definición  de  extremo 
relativo  (def.  24):  supongamos  que  / : [a,  b]  — > M es  continua  y derivadle 
en  (a,  b ).  Un  extremo  relativo  de  / en  (a,  b)  (nótese  que  es  en  el  interior ) 
es  un  punto  c en  el  que  /(c)  es  máximo  localmente  ó mínimo  localmente 
(cerca  de  c).  Recordemos  que  la  derivada  de  / en  un  extremo  relativo 
en  (a,  b)  es  0 (insistimos  en  que  debe  ser  en  el  interior). 

Los  valores  extrémales  son  interesantes.  Si  f(x)  es  la  energía  de 
una  partícula  en  la  posición  x,  entonces  un  máximo  es  un  punto  de 
equilibrio  inestable  (¿por  qué?)  y un  mínimo  es  un  punto  de  equilibrio 
estable  (¿por  qué?).  Como  se  ve,  para  calcular  los  valores  extrémales 
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se  han  de  buscar  primero  los  puntos  de  derivada  0,  que  se  denominan 
puntos  críticos.  Una  vez  encontrados,  hace  falta  discernir  los  máximos 
de  los  mínimos  y de  los  que  no  son  extremos. 

Lema  7.  Sea  c e (a,  b ) un  punto  en  que  f'(c)  = 0.  Supongamos  que 
las  derivadas  superiores  son  todas  cero  hasta  la  k — l—ésima.  Entonces: 

■ Si  k es  impar,  el  punto  no  es  un  extremo. 

■ Si  k es  par,  el  punto  es  un  máximo  si  f^kflc)  < 0 y es  un  mínimo 
si  f(k\c)  > 0. 

Demostración.  Esto  es  evidente.  Sabemos,  por  el  Teorema  de 
Taylor,  que 

f(c+(x-c))  = f(c)+f(c)(x-c)+---+^f{k\c)(x-c)k+(x-c)kd(x-c) 

donde  d(x  — c)  es  un  infinitésimo.  Pero  hemos  quedado  en  que  todas 
las  derivadas  son  0 en  c hasta  la  k — 1.  Por  tanto,  queda: 

f(c  + (x-  c))  = /(c)  + ^f{k\c)(x  - c)k  + (x-  c)kd(x  - c). 

Si  k es  impar,  el  factor  (x  — c)k  cambia  de  signo  al  pasar  por  c y c no 
puede  ser  ni  máximo  ni  mínimo.  Si  k es  par,  ese  factor  no  cambia  de 
signo  y el  término  correspondiente  suma  si  f^flc)  > 0 (así  que  c es  un 
mínimo)  y resta  si  es  negativo  (así  que  c es  un  máximo).  □ 

Los  puntos  con  derivada  0 que  no  son  mínimos  ni  máximos  son 
puntos  de  inflexión , que  estudiaremos  más  adelante. 

8.3.  Concavidad  y convexidad.  La  función  más  sencilla  es  una 

recta  (las  constantes  son  rectas).  Lo  normal  es  comparar  cualquier  gráfi- 
ca con  una  recta.  La  derivada  de  una  función  sirve  para  esa  compara- 
ción de  manera  local , cerca  del  punto  en  que  se  deriva.  Una  compara- 
ción global  es  más  compleja  pero  puede  llevarse  a cabo  con  una  buena 
definición. 

Definición  25.  Sea  / : [a,  b]  — > M una  función  continua.  Se  dice 
que  / es  convexa  si  para  cualesquiera  c < d E [a,b]  se  tiene  que  la 
gráfica  de  f está  por  debajo  del  segmento  que  une  ( c, /(c ))  y (d,f(d)). 
Dicho  con  propiedad: 

f(c  + A(d  - c))  < /(c)  + A (f(d)  - /(c)). 

Si  la  desigualdad  es  de  signo  contrario,  se  dice  que  / es  cóncava  en 

[a,  61- 

Cuando  una  gráfica  pasa  de  se  cóncava  a ser  convexa,  se  nota  cierta 
torsión  en  el  punto  correspondiente: 

Definición  26.  Un  punto  de  inflexión  de  una  función  / es  un 
punto  c tal  que  / es  convexa  a un  lado  de  c y cóncava  al  otro. 
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Figura  22.  La  función  / es  convexa:  Todos  los  seg- 
mentos están  “por  encima”  de  la  gráfica.  La  función  g es 
cóncava. 


La  noción  de  concavidad  y convexidad  es  muy  relevante  desde  el 
punto  de  vista  físico  (y,  en  general,  en  cualquier  contexto,  un  objeto 
convexo  tiene  unas  propiedades  físicas  y geométricas  especiales  e inte- 
resantes). El  caso  es  que  es  posible  detectar  la  convexidad  mediante  las 
derivadas  de  orden  superior.  ¿Cómo  se  puede  definir  la  convexidad  de 
manera  más  local?  Si  uno  le  da  suficientes  vueltas,  debería  llegar  a la 
conclusión  de  que: 

Una  función  es  convexa  en  [a,  b]  si  cada  punto  de  la  gráfica  en  el 
interior  (a,  b)  es  un  mínimo  local  cuando  se  cambia  el  eje  de  las  x por 
la  recta  que  une  dos  puntos  (c,  /(c))  y (d,  f(d))  con  c < d. 

Otra  manera  de  verlo  es: 

Lema  8.  Sea  f : [a,  b]  — > M.  Si  f es  convexa  en  (a,  b ) y derivable  dos 
veces  en  (a,  b ) entonces  cualquier  recta  tangente  a f en  (a,  b ) queda  por 
debajo  de  la  gráfica  de  f.  Si  es  cóncava  en  ( a,b ),  entonces  las  rectas 
tangentes  quedan  por  encima. 

Esta  condición  es  muy  sencilla  de  comprobar:  Se  está  diciendo  que 

f(x o + (x  - x0))  = f(x)  > f\x 0)(x  - x0)  + f(x o) 

cerca  de  cada  punto  xq.  Es  decir: 

f{x)  - (/' (x0)(x  - x0)  + /Oo))  > 0 

pero  está  claro  que  el  miembro  de  la  izquierda  vale  0 en  x0.  Por  tanto, 
se  está  exigiendo  que  el  miembro  de  la  izquierda  tenga  un  máximo  en 
xq.  Así  pues,  utilizando  el  Lema  7,  se  tiene  que: 

Lema  9.  Sea  f : [a,  b]  — > R una  función  derivable  2 veces  y c G 
(a,  b).  Entonces: 

■ Si  f"[c ) > 0,  entonces  f es  convexa  en  un  entorno  de  c. 

■ Si  f"(c)  < 0,  entonces  f es  cóncava  en  un  entorno  de  c. 

■ Si  f"(c)  = 0,  entonces  no  se  sabe. 
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Definición  27.  Un  punto  de  inflexión  de  / : (a,  b)  — > M es  un 
punto  c G (a,  6)  tal  que  / es  cóncava  a un  lado  de  c y convexa  al  otro. 
Si  / es  derivadle  dos  veces  en  c,  entonces  f"(c)  = 0. 

Pero  no  necesariamente  ocurre  que  si  la  derivada  segunda  es  0,  la 
función  tiene  ahí  un  punto  de  inflexión,  hay  que  estudiar  la  concavidad 
y convexaidad  a cada  lado  del  punto. 

8.4.  Asíntotas.  La  gráfica  de  una  función,  una  vez  detectados 
los  puntos  de  corte  con  los  ejes,  los  extremos  relativos  y las  zonas 
de  concavidad  y convexidad  está  prácticamente  determinada,  salvo  el 
comportamiento  en  el  infinito. 

Por  un  lado  está  el  infinito  (positivo  y negativo)  del  eje  OX.  Para 
estudiar  cómo  se  comporta  la  función  en  esta  dirección  se  calculará  el 
límite  cuando  x tiende  a ±oo  (es  decir,  dos  límites  distintos). 

Para  que  la  gráfica  se  vaya  hacia  infinito  de  modo  paralelo  al  eje 
OY  hace  falta  que  haya  un  punto  c G R.  tal  que  o bien  el  límite  por  la 
derecha  o bien  el  límite  por  la  izquierda  de  f(x)  en  c sea  infinito. 

De  todos  modos,  el  comportamiento  en  la  dirección  OX  puede  ser 
variado.  Hay  una  caracterización  que  es  bastante  útil:  las  asíntotas. 

Definición  28.  Sea  / : M — ► M una  función  y sea  r = y = ax  + b 
una  recta.  Se  dice  que  r es  una  asíntota  de  / hacia  +oo  si 

lím  f(x ) — ( ax  — b)  = 0. 

X — 

(Se  dice  hacia  — oo  si  ocurre  lo  mismo  en  — oo).  Si  a = 0 entonces  se 
habla  de  asíntota  horizontal , si  no,  de  asíntota  oblicua. 

Una  asíntota  es  una  recta  que  se  acerca  mucho  a la  gráfica  (o  más 
bien  una  recta  a la  que  la  gráfica  se  acerca  mucho).  ¿Cómo  se  sabe  si 
una  función  tiene  asíntotas  en  infinito? 

Lema  10  (Cálculo  de  las  asíntotas  en  infinito).  Sea  f : (A,  oo)  — > M 
una  función.  La  recta  y = ax  + b es  una  asíntota  de  f en  +oo  si  y solo 
si  se  cumplen  las  dos  condiciones  siguientes: 

■ lím^oc  ÍM  = a. 

■ líni^oc  f(x)  — ax  — b. 

(Lo  mismo  con  — oo  para  las  asintótas  en  —oo). 

La  demostración  de  este  lema  es  obvia,  por  la  definición  de  asíntota. 

Para  calcular  las  asíntotas  verticales  hay  que  saber  cuándo  una  fun- 
ción tiene  límite  infinito  (p.ej.  en  los  ceros  del  denominador  es  posible 
que  ocurra. . . ). 

Además  de  acercarse,  conviene  saber  si  la  función  lo  hace  por  arriba 
o por  debajo  de  la  asíntota.  Para  conocer  esto  es  preciso  conocer  el  signo 
de  f{x)  — ax  — b:  si  es  positivo  desde  un  cierto  momento,  la  asíntota 
queda  por  debajo  de  f(x),  si  es  negativo  desde  un  cierto  momento,  la 
asíntota  queda  por  encima.  Podría  cambiar  de  signo  infinitas  veces,  en 
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cuyo  caso  la  cortaría  también  un  número  infinito  de  veces.  De  todas 
maneras,  es  más  sencillo  lo  siguiente: 

Lema  11.  Sea  f : M — > M una  función.  Supongamos  que  admite  la 
asíntota  r = y — ax  + b en  ±oo.  Entonces: 

■ Si  f es  convexa  a partir  de  un  momento  ( bien  por  la  izquierda, 
bien  por  la  derecha),  f queda  por  encima  de  r a partir  de  ese 
momento. 

■ Si  f es  cóncava  a partir  de  un  momento  ( bien  por  la  izquierda, 
bien  por  la  derecha),  f queda  por  debajo  de  r a partir  de  ese 
momento. 

Como  sabemos,  para  saber  si  / es  convexa  o cóncava,  basta  mirar 
el  signo  de  la  derivada  segunda. 

Nota  3.  Nótese  que  en  una  asíntota  vertical,  la  función  es  convexa 
si  va  hacia  +oo  y cóncava  si  va  hacia  — oo. 

Esto  es  lo  más  que  se  suele  hacer.  Sin  embargo,  uno  puede  utilizar 
los  órdenes  de  infinitud  para,  por  ejemplo,  dibujar  varias  gráficas  en  el 
mismo  eje  de  coordenadas. 


CAPITULO  3 


Cálculo  integral  de  una  variable 

Terminado  el  estudio  local  de  las  funciones  reales  de  una  variable 
real,  especialmente  el  problema  de  la  tangencia  y la  aproximación  de 
funciones  por  polinomios  (que  son  quizás  los  problemas  esenciales  del 
cálculo  infinitesimal),  se  aborda  clásicamente  la  teoría  de  integración, 
como  la  operación  dual  de  la  derivación. 

En  estos  apuntes  vamos  a hacer  una  introducción  más  o menos  ri- 
gurosa, sin  preocuparnos  demasiado  por  la  formalidad,  dando  especial 
énfasis  a la  noción  de  integral  como  masa  calculada  a partir  de  una 
función  de  densidad.  Pensamos  que  este  (y  no  necesariamente  el  área 
bajo  una  curva)  es  el  concepto  clave  con  que  los  alumnos  deben  fa- 
miliarizarse, pues  es  el  concepto  físico  que  van  a encontrar.  Con  esta 
idea,  utilizaremos  la  potencia  de  los  teoremas  del  valor  medio  para  aco- 
tar integrales  (y  por  tanto  acotar  masas,  espacios...),  que  pensamos 
que  es  lo  más  útil  que  se  puede  aprender,  mucho  más  que  las  técnicas 
de  integración,  que  hoy  día  son  inútiles  dada  la  ubicuidad  de  medios 
informáticos  (cf.  wolframalpha.com). 

1.  Integral  de  Riemann 

Supongamos  que  se  tiene  una  tabla  como  la  1,  de  velocidades  ins- 
tantáneas de  un  cohete  en  intervalos  de  ls,  tal  como  las  ha  recogido  el 
velocímetro.  ¿Es  posible  hacerse  una  idea  del  espacio  total  recorrido  por 
el  cohete?  (Asumiendo  que  la  trayectoria  es  una  línea  recta  perfecta, 
claro) . 


0 10 

1 100 

2 250 

3 500 

4 700 

5 950 

6 1100 

7 1050 

8 1090 

9 1100 

Cuadro  1.  Velocidades  de  un  cohete  (en  m/s). 
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Por  supuesto,  algo  siempre  se  puede  hacer,  aunque  sea  inexacto. 
Lo  más  sencillo  (que  por  supuesto  es  bastante  impreciso,  pero  no  deja 
de  ser  lo  más  sencillo)  es  suponer  que  la  velocidad  es  constante  en 
cada  intervalo  de  segundo  y simplemente  calcular  cuánto  espacio  habría 
recorrido  a esa  velocidad  en  ese  tiempo  y sumar  todos  los  espacios: 

10 m/s  ■ 1 s + 100 m/s  ■ ls  + 250m/.s  • ls  -\ + 1100 m/s  ■ 1 s = 6850m 

casi  siete  kilómetros.  Desde  luego,  esto  es  un  cálculo  bastante  poco 
aproximado,  pero  algo  tenemos. 

Si  el  velocímetro  tomara  medidas  con  más  frecuencia  (cada  centési- 
ma, por  ejemplo,  o cada  milisegundo)  tendríamos  una  tabla  mucho 
más  larga  y presumiblemente  el  resultado  final  se  acercaría  más  a la 
realidad. 

Esa  es  la  idea  de  Riemann,  un  poco  más  elaborada  para  qne  real- 
mente tenga  sentido  la  noción  de  qne  “uno  se  acerca”  al  valor  real. 

1.1.  Particiones,  suma  inferior,  suma  superior.  En  Cálculo, 

más  que  buscar  resultados  exactos  de  manera  directa,  siempre  se  hacen 
las  cosas  acotando.  La  noción  de  límite  clásica  con  e y 5 no  es  más  qne 
una  manera  técnica  de  afirmar  qne  se  pueden  encontrar  cotas  cada  vez 
más  pequeñas  del  error  de  aproximación  a un  valor  (el  límite).  Con  la 
integral  pasa  algo  similar. 

Sea,  de  ahora  en  adelante,  [a,  b]  un  intervalo  compacto  fijo  (es  decir, 
a < b son  dos  números  reales.  Sea  / : [a,  b\  — > M una  función  acotada 
(de  momento  solo  ponemos  esta  condición,  qne  relajaremos  cuando 
hablemos  de  integrales  impropias). 

Definición  29.  Una  partición  de  [a,  b]  es  una  familia  finita  de 
elementos  de  [a,  b]  qne  empieza  en  a y termina  en  b: 

ai  — a < a2  < a3  <...<  an  < an+\  = b 

Lo  escribimos  así  para  qne  el  intervalo  esté  dividido  en  n subintervalos. 

Como  la  función  / es  acotada  en  todo  el  intervalo  [a,  b\,  en  cada 
uno  de  los  subintervalos  [at,  a¿+i]  y,  por  la  completitud  de  M,  esto  quie- 
re decir  que  en  cada  subintervalo,  / tiene  un  supremo  y un  ínfimo  (no 
necesariamente  un  máximo  y un  mínimo,  porque  / no  es  continua  ne- 
cesariamente). Llamemos  ml  al  ínfimo  en  [a¿,  a¿+i]  y M¿  al  supremo.  Es 
decir,  estamos  seguros  de  que 

(3)  mi  < f(x)  < Mi  en  [ &Z+l]  * 

(así  que  la  gráfica  de  / en  ese  intervalo  está  entre  la  banda  horizontal 
de  altura  m,t  y la  de  altura  M¿). 

Definición  30.  Dada  una  partición  P de  [a,  b]  en  n subintervalos 
como  arriba,  se  definen: 
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■ La  suma  superior  de  / para  P como 

n 

SP(f ) = J^(a¿+i  - a i)  Mi: 

Í=  1 

■ La  suma  inferior  de  / para  P como 

n 

Sp(f ) = ^(a¿+i  - a¿)m¿ 

2=1 

que  representan  las  áreas  bajo  las  funciones  escalonadas  en  esa  parti- 
ción. 

Las  sumas  superior  e inferior  sirven  como  cotas  del  área  entre  el 
eje  OX  y la  gráfica  de  / (poniendo  en  negativo  lo  que  cae  debajo  del 
eje).  Es  decir,  si  se  puede  hablar  de  área  de  esa  gráfica,  entonces  tiene 
que  estar  entre  esos  dos  valores. 

Lina  vez  acotada  la  posible  área,  se  procede  como  se  hace  siempre  a 
pasar  al  limite.  En  este  caso  es  algo  más  complicado,  porque  depende 
de  la  partición,  etc. . . Vamos  a hacerlo  de  manera  directa  y a correr. 

Lema  12.  Las  sumas  superiores  de  f en  [a,  b]  están  todas  acotadas 
inferiormente  y las  sumas  inferiores  están  todas  acotadas  superiormen- 
te. 


Demostración.  Esto  es  evidente  (o  debería  serlo).  Es  un  buen 
ejercicio.  □ 

Téngase  en  cuenta  que  — y esto  es  otro  buen  ejercicio — cuanto  más 
fina  es  una  partición  (¿cómo  se  definiría  esto?)  la  suma  superior  decrece 
y la  suma  inferior  crece. 

Con  este  resultado  en  la  mano,  sabemos  que 

■ El  conjunto  de  todas  las  sumas  superiores  de  / en  [a,  b]  está  aco- 
tado inferiormente. 

■ El  conjunto  de  todas  las  sumas  inferiores  de  / en  [o,  b]  esá  acotad 
superiormente. 

Por  el  axioma  de  los  Intervalos  Encajados  (o  por  el  principio  del  su- 
premo) se  deduce  que 

■ El  conjunto  de  las  sumas  superiores  tiene  un  infimo.  Llamémosle 

S{f). 

■ El  conjunto  de  las  sumas  inferiores  tiene  un  máximo.  Llamémos- 
le s(f). 

La  idea  es  decir  que  una  función  tiene  área  si  “el  área  por  debajo 
es  igual  que  el  área  por  encima”: 

Definición  31.  Una  función  f : [a,b]  — > M acotada  se  dice  inte- 
grable Riemann  si  S(f)  = s(f).  Si  el  ínfimo  de  las  sumas  superiores  es 
igual  al  supremo  de  las  sumas  inferiores. 
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Existen  funciones  que  no  son  integrables  Riemann  (la  función  ca- 
racterística de  Q,  por  ejemplo),  pero  la  gran  mayoría  de  las  que  uno  se 
encuentra  lo  son: 

Lema  13.  Sea  f : [a,  b]  — > M una  función  acotada.  Si  f es  continua 
salvo  en  un  número  finito  de  puntos  o si  f es  monótona  a trozos, 
entonces  f es  integrable  Riemann. 

Nota  4.  Una  función  / : [a,  b]  — > M es  monótona  a trozos  si  existe 
una  partición  de  [a,  b],  a i = a, . . . , an+ 1 = b tal  que  para  todo  i,  f es 
monótona  en  (a¿,a.¿+ 1). 

Definición  32.  Si  / : [a,  b]  — > M es  integrable  Riemann,  se  define 
la  integral  de  f en  [a,  6]  como  el  supremo  de  las  sumas  inferiores  o el 
ínfimo  de  las  sumas  superiores  (que  son  iguales)  y se  denota 

f(x)  dx. 

Donde  x no  es  más  que  el  nombre  de  la  variable  de  integración.  El 
factor  dx  es  fundamental:  indica  que  el  valor  f(x)  de  la  función  de 
densidad  se  multiplica  por  la  longitud  del  segmento  “en  el  punto  x” 
(una  longitud  infinitesimal)  y queda  —cm  = gr , masa. 

La  integral  de  una  función  es  mucho  más  que  el  área  entre  la  gráfica 
y el  eje  OX: 

■ Indica  la  masa  del  segmento  [a,  b]  si  / denota  una  función  de 
densidad. 

■ Indica  la  carga  total  del  segmento  [a,  b]  si  / denota  una  función 
de  densidad  de  carga. 

■ Indica  el  espacio  recorrido  entre  el  instante  a y el  b si  / es  una 
función  de  velocidad  lineal  (el  espacio  recorrido  en  línea  recta, 
claro) . 

Todos  esos  conceptos  son  los  de  integral  y responden,  claro  a que  la 
función  que  se  integra  es  la  razón  de  lo  que  se  calcula  con  respecto  a la 
variable  independiente:  la  densidad  lineal  es  la  razón  entre  la  masa  y la 
longitud,  la  densidad  de  carga  lineal  es  la  razón  entre  la  carga  eléctrica  y 
la  longitud,  la  velocidad  es  la  razón  entre  el  espacio  y el  tiempo. . . Dicho 
de  otro  modo,  la  cantidad  que  se  integra  es,  puntualmente,  la  derivada 
de  la  cantidad  que  se  calcula. 

2.  Teoremas  fundamentales 

Antes  de  nada,  debería  ser  muy  sencillo  comprobar  (no  lo  vamos 
a hacer)  que,  si  f : [a,b]  — > M es  una  función  acotada  e integrable 
Riemann,  entonces  para  cada  x G [a,  b] , / es  también  integrable  en 
[a,x].  Se  puede  por  tanto  definir  la  función  integral: 
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Definición  33.  Dada  / : [a,  b]  M integrable  Riemann,  se  define 
la  función  integral  de  f en  [o,  b]  como 

nx 

F{x ) = / f(x)  dx. 

J a 

Por  así  decir,  para  cada  x,  la  función  F(x)  es  la  masa  de  la  varilla  de 
extremos  a y a:  si  la  densidad  lineal  es  f(x).  La  relación  entre  estas  dos 
funciones  viene  dada  por  el  Teorema  Fundamental  del  Cálculo  Integral: 


Teorema  11.  Sea  f : [a,  b]  — > M una  función  continua  (que, 
por  tanto,  es  integrable  Riemann)  y sea  F(x)  su  integral  (F(x)  = 
Ja  f(t)dt).  Se  tiene  que  F(x)  es  derivable  en  ( a,b ) y que 


f w - /(<=)  ^ 

la  derivada  de  la  función  integral  es  la  función  que  se  integra. 


Así  pues,  la  idea  elemental  de  que  la  derivada  de  la  masa  es  la 
densidad  es  enunciable  formalmente  y es  justamente  el  principio  que 
acabamos  de  expresar.  Más  aun: 

Teorema  12  (Regla  de  Barrow).  Supongamos  que  f : [a,  b]  — > R 
es  integrable  en  [a,b]  y que  F : [a,  b]  — > M es  tal  que  F'(x)  = f(x)  para 
cada  x G (a,  b).  Entonces 

f(x)  dx  = F(b)-F(a). 


Esto  es  más  obvio  de  lo  que  parece , aunque  no  sea  obvio  en  absolu- 
to. . . 

Para  diferenciar  la  función  integral  y la  integral , se  usa  las  siguiente 
nomenclatura: 

Integral:  Se  denomina  integral  definida  o integral  de  / (si  / : 
[o,  b]  — > M es  acotada  e integrable  en  [a,  b])  al  número 

f(x)  dx 

Primitiva:  Se  denomina  primitiva  de  / (acotada  e integrable  en 
[a,  á])  a cualquier  función  que  cumpla  F'(x)  = f(x)  en  cada 
punto  de  (a,  b). 

Lema  14.  Supongamos  que  f : [a,b\  — > X es  acotada  e integrable 
en  [ a,b } y que  F(x)  y G(x)  son  dos  primitivas  de  f en  [a,b\.  Entonces 
F(x ) — G(x)  = cte. 


Esto,  junto  con  el  Teorema  Fundamental  del  Cálculo  Integral  quiere 
decir  que  si  F{x)  es  una  primitiva  de  / en  [a,  b]  donde  f es  acotada  e 
integrable,  entonces  existe  una  constante  c tal  que 


F(x) 


f(t ) dt  + c. 


•X 
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De  ahí  que  se  “diga”  que  la  primitiva  de  f es  la  integral  más  una 
constante  arbitraria.  También  se  escribe: 

J f{x)dx 

para  denotar  una  primitiva  de  f(x),  sin  especificar  el  intervalo  de  inte- 
gración. 

Otra  igualdad  que  es  evidente  de  todo  lo  dicho,  es  (en  las  condicio- 
nes adecuadas,  etc): 

J f(x)  dx  = f(x)  + O, 

que  puede  leerse  la  integral  es  la  operación  inversa  de  la  derivada. 


2.1.  Propiedades  de  la  integral  definida.  Fijamos  para  esta 
sección  funciones  /,  g : [a,  b]  — > M acotadas  e integrables.  Entonces: 

1.  La  integral  es  lineal:  si  A,  /i  G M: 

pb  pb  pb 

/ Xf  + ng  dx  — X f(x)  dx  + p f(x)  dx. 

Ja  Ja  Ja 

2.  Se  cumple  la  “desigualdad  triangular”  (aunque  no  tiene  nada 
de  triangular): 

I [ f(x)dx | < í \f(x)\  dx 

Ja  Ja 

3.  Si  f(x)  < g(x)  en  [a,  b]  y ambas  son  integrables,  entonces 


/ f{x)dx<  / g(x)dx. 

Ja  Ja 

Este  resultado  es  posiblemente  el  más  útil  en  la  práctica,  pues 
permite,  si  se  conoce  alguna  cota  de  la  función,  acotar  la  integral 
por  arriba  y por  abajo. 

4.  Si  c G [a,  b]  y / es  acotada  e integrable  en  [a,  b]  entonces 

pb  pe  pb 

/ f(x)  dx=  f(x)  dx+  f{x)  dx 

Ja  Ja  Je 

(la  integral  es  aditiva  en  el  conjunto  de  integración). 

5.  Si  / : [a,  b]  — > M es  acotada  e integrable  y g es  igual  a / salvo  en 
un  número  finito  de  puntos,  entonces  g también  es  integrable  y 

pb  pb 

/ f(x)  dx  — g(x)  dx 
Ja  Ja 

6.  La  integral  en  un  punto  es  cero: 

í f{x ) dx  = 0. 
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7.  El  siguiente  resultado  es  consecuencia  de  los  anteriores,  pero  es 
importante:  si  / : [a,  b]  — > M es  convexa,  acotada  e integrable, 
entonces 


rtf(x)dx<m±M(b 


pues  el  miembro  de  la  derecha  es  el  área  que  hay  entre  el  eje 
OX  y el  segmento  que  une  (a, /(a))  con  (6, /(&))•* 

Se  podrían  enumerar  muchas  más  propiedades,  pero  las  de  arriba  son 
quizás  las  más  importantes  y lo  interesante  es  que,  mediante  ejercicios, 
el  alumno  se  acostumbre  a razonar  acotando  y estimando  el  valor  de 
una  integral  (que  es,  entre  otras  cosas,  lo  que  terminará  haciendo  en  la 
asignatura  de  Métodos  Numéricos). 

Un  último  comentario.  Se  podría  formalizar  lo  que  sigue,  pero  lo 
vamos  a enunciar  como  un  mero  axioma: 


Fixme:  dibujar  el  área 
aquí. 


Nota  5.  Si  el  intervalo  de  integración  está  de  mayor  a menor , 
entonces  el  valor  de  la  integral  se  cambia  de  signo: 

pa  pb 


f(x)  dx  = 


f(x)  dx. 


Es  importante  hacer  notar  que  esto  se  hace  exclusivamente  para  sim- 
plificar los  cambios  de  variables  y porque  M está  orientado.  En  este 
sentido,  podría  formalizarse  esta  fórmula  hablando  de  formas  de  volu- 
men, etc. . . pero  no  vamos  a liar  al  lector:  tómelo  como  un  axioma  que 
funciona. 

Para  terminar,  la  siguiente  notación  es  habitual: 

H(x)  b = H{b)  — H(a). 


3.  Teoremas  de  acotación 

El  resultado  dual  del  Teorema  del  Valor  Medio  (Teoremas  8 y 7) 

Teorema  13  (Teorema  de  la  Media).  Sea  f : [a,b]  — > M una  fun- 
ción continua  (que,  por  tanto,  es  integrable  Riemann).  Existe  c G (a,  b) 
tal  que 

(> b-a)f(c ) = I f(x)  dx. 

J a 

De  hecho,  si  m y M son  el  mínimo  y el  máximo  de  los  valores  de  f en 
[a,b],  entonces  se  tienen  las  cotas: 

m(b  — a)<  í f(x)dx<M(b  — a). 

J a 

Y cualquiera  de  las  igualdades  se  da  si  y solo  si  f es  constante. 
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De  aquí  se  deduce  que  la  integral  de  una  función  continua  en  [o,  b] 
y no  negativa  es  no  negativa  (y,  de  hecho,  es  positiva  si  f(c)  > 0 en 
algún  punto  de  [a,  b]). 

4.  Los  dos  “métodos”  de  integración 

Uno  de  los  problemas  clásicos  más  pesados  es  calcular  la  primitiva 
de  una  función  integrable.  Para  empezar,  hay  funciones  cuyas  primiti- 
vas se  conocen  por  ser  derivdas  de  funciones  conocidas;  estas  se  llaman 
integrales  inmediatas.  Unas  cuantas  se  detallan  en  la  Tabla  2.  Nótese 
que  en  las  integrales  que  especifican  intervalos,  es  esencial  que  los  in- 
tervalos estén  especificados.  Cualquier  programa  de  integración  calcula 
mucho  más  rápido  que  un  humano,  sin  embargo. 


J k dx  = kx  + C 

í xa  dx  = 1 xa+1  + C 

J 0¿  + 1 

[ — dx  — log  \x\  + C 

J x 

J 

[ cx  dx  = - — cx  + C c > 0 
log(c) 

J 

-1 

sen(na;)d  = — cosínx)  + C 
n 

/: 

1 

— dx  = asen(x)  + C 

ivTi-x2) 

J 

f 1 

í cos(nx)d  = — sen (nx)  + C 
n 

./ 

'*  -1 

. dx  = acos(ad  + C 

-iVl-x2  y J 

fx  1 

/ ...  , = tan(x)  + C 

J-n/2  C0S\X) 

f 1 

/ — dx  = atan(x)  + C 

] x¿  + 1 

Cuadro  2.  Algunas  integrales  inmediatas.  Para  las  que 
dan  el  arcoseno  y el  arcocoseno,  x G [—1,1].  Para  la  que 
da  la  tangente,  x e [7t/2,  7t/2]  . 


Para  calcular  integrales  y primitivas  con  wolf  ramalpha  no  hay  más 
que  escribir 

int(f (x) ,x,a,b) 

que  significa 

f(x ) dx 

si  se  quiere  calcular  una  primitiva,  basta  omitir  los  extremos  del  inter- 
valo de  integración. 

Sin  embargo,  hay  dos  técnicas  que  se  utilizan  clásicamente  para 
intentar  reducir  integrales  a alguna  integral  inmediata : el  cambio  de 
variable  y la  integración  por  partes. 

4.1.  Cambio  de  variable.  El  cambio  de  variable  en  la  integral 

es  el  resultado  de  trasladar  la  regla  de  la  cadena  (de  la  derivada)  al 
cálculo  integral.  Recordamos  que,  si  g : [a,  b]  — > M es  derivable  en  (a,  b) 
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y su  imagen  está  contenida  en  [c,  d]  f : [c,  d]  — > M es  derivablc  en  (c,  d) 
entonces 

f(g(x))’  = g'(x)f'(g(x)). 

Si  en  vez  de  derivar,  se  integra,  como  sabemos  que  la  integral  es  la 
operación  inversa  de  la  derivada,  queda  algo  parecido , aunque  para 
enunciarlo  con  propiedad  hay  que  tener  más  cuidado. 

Teorema  14.  Sean  g : [a,  b\  — > M y f : [c,  d]  — > M funciones 
acotadas  e integrables  y tales  que  g([a,b])  C [c,  d] . Supongamos  además 
que  g es  derivable  en  (a,  b ) y sean  r = g(a),  s = g{b).  Entonces 

pg(b)  !■ s r-b 

/ f(x)dx=  f{x)  dx  — f(g(t))g\t)dt 

J g(a)  J r Ja 

donde  se  sobreentiende  (como  se  explicón  en  la  Nota  5),  que  si  r > s,  se 
cambia  el  signo  a la  integral  y se  pone  con  los  extremos  bien  ordenados. 

La  primera  consecuencia  obvia  es  que  las  traslaciones  de  la  variable 
no  afectan  prácticamente  a la  integración:  si  F(x ) es  la  primitiva  de  /, 
entonces  F{x  + c)  es  la  primitiva  de  f(x  + c).  Por  ejemplo: 


sen(a;  + u)  dx  = — cos(x  + u)  + C, 


(x  + a)r  dx  = 


(x  + a)r+1  para  r ^ — 1. 


r + 1 


La  siguiente  es  que  las  homotecias  afectan  a la  integral  dividiendo : 
si  F(x)  es  la  primitiva  de  /,  entonces,  ^ F(ax ) es  la  primitiva  de  f(ax). 
Por  ejemplo: 


Vf1 


dx  = - asen(aa;)  + C, 


2rr2 


a^x 


= - log  | ax  + b\ 


ax  + b a 


4.2.  Integración  por  partes.  Por  otro  lado,  la  fórmula  de  Leib- 

niz  para  el  producto  de  las  derivadas: 

(fg)'(x)  = f\x)g{x)  + f(x)g'(x) 
permite  simplificar  algunas  integrales,  escribiéndola  así : 

f{x)g'{x)  = ( fg)'(x ) - f(x)g(x). 

En  concreto: 

Teorema  15.  Sean  f,g  funciones  acotadas  integrables  en  [a,b]  y 
derivables  en  ( a,b ).  Entonces 

í f(x)g'(x)  dx  — f(x)g(x)\  -í  g(x)f\x)dx. 
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Este  resultado  permite  simplificar  algunas  integrales  que  contienen 
una  parte  sencilla  de  integrar  y otra  cuya  derivada  simplifica  la  expre- 
sión. 

Ejemplos: 

Ix  sen(x)dx- 

no  es  inmediata,  pero  la  función  seno  es  sencilla  de  integrar  y da  una 
función  también  sencilla  de  integrar  mientras  que  x,  al  derivarla  queda 
1 . Así  que  (y  aquí  mostramos  la  manera  clásica  de  escribir  la  integración 
por  partes)  se  puede  hacer: 

u = x du  = dx 

dv  = sen(x)  dx  v = — cos(a;) 

de  donde 

J xsen(x)dx  — — ^cos(x)  — J sen(x)  dx, 
la  última  integral  es  inmediata,  así  que 

J xsen(x)  dx  — — xcos(x)  + cos(z)  — cos(x)(l  — x). 


Si  la  integral  fuera  definida,  habría  que  poner  los  extremos  de  integra- 
ción por  doquier  y tener  mucho  cuidado  con  los  signos. 

4-2.1.  El  resto  integral  del  desarrollo  de  Taylor.  Recordemos  que 
si  / : (a  — e,  a+e)  — > R.  es  derivable  n + 1 veces  en  el  intervalo,  entonces, 
por  la  Fórmula  de  Taylor  (Teorema  9),  se  puede  escribir: 

f(x)  = f (a)  + ~ a)  d ó 1 (. x - a)n  + Rn(x) 

donde 

\Rn(x)\  < — - — M\x  — a\n+1. 
n + 1 

El  método  de  integración  por  partes  permite,  con  un  poco  de  inge- 
nio, dar  una  fórumula  precisa  para  el  resto.  En  concreto, 

Rn(x)=  r 

Ja  n\ 


La  prueba  de  esta  fórmula  es  sencilla  por  inducción.  Para  el  caso 
n — 1,  se  calcula 

f(x)-f(a)=  I f\t)  dt 


integrando  por  partes: 


f'(t)  = u f"{t)dt  = du 
dt  = dv  t — x = v 
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nótese  que,  por  conveniencia,  en  lugar  de  tomar  f dt  = t,  tomamos 
J dt  — t — x,  que  también  sirve.  Pasando  f(a)  al  segundo  miembro  y 
utilizando  la  fórmula  de  integración  por  partes,  queda 

f(x)  = f (a)  + (t  — x)f'{t)  - í ( t-x)f"(t)dt 

a Ja 

que,  desarrollando,  da 

f(x)  = f(x)  + f(a)(x  - a)  + í (x-  t)f"(t)  dt 

J a 

que  es  el  resultado  para  n — 1.  No  hay  más  que  seguir  utilizando  la 
fórmula  de  integración  por  partes  para  razonar  por  inducción. 

Esta  expresión  del  resto  es  fundamental  porque  permite  concer  la 
precisión  de  una  fórmula.  Por  ejemplo:  el  desarrollo  de  Taylor  de  la 
exponencial  es 

r2  n i rx 

ex  = l+x  + - + ---  + ^-  + - — / (x-í)Vdí 

2!  n\  (n  + l)!./0 

(puesto  que  la  derivada  n— ésirna  de  ex  es  ex).  Se  sabe  que  ex  < 3 para 
|x|  < 1,  así  que  si  n = 10,  el  error  que  se  comete  utilizando  el  polinomio 
de  Taylor  de  grado  10  para  calcular  e1  = 1,  es  menor  o igual  que: 

r= 

pero  1 — t < 1 si  t G [0, 1]  y e4  < 3,  por  tanto: 

3 1 

11  “ 11!  13305600’ 

(aunque  esta  es  una  cota  muy  burda,  pero  da  igual):  es  decir,  la  apro- 
ximación tiene  al  menos  6 dígitos  decimales  de  precisión.  Y es  sencilla 
de  calcular: 

11  1 

e~lH 1 — - + • • • d r — 2,718281+ 

2 3!  10! 

no  está  nada  mal  (de  hecho  hay  otro  dígito,  un  8,  que  es  preciso,  pero 
no  vamos  a explicar  por  qué). 

5.  Integrales  impropias 

Hasta  ahora  hemos  trabajado  con  funciones  acotadas  (la  definición 
que  hemos  dado  de  integrabilidad  solo  se  refiere  a ellas)  y con  inter- 
valos acotados  (de  la  forma  [a,  b]  con  a,b  e M).  Está  claro  que  hay 
ocasiones  en  que  o bien  la  función  o bien  el  intervalo  no  está  acotado 
pero  tiene  sentido  preguntarse  por  la  integración.  Especialmente  cuan- 
do, para  simplificar,  se  modelan  elementos  de  longitud  o valor  infinito. 
Por  ejemplo:  si  una  varilla  infinita  tiene  densidad  e-1^  g/cm  en  cada 
punto  de  coordenada  x,  ¿cuál  es  su  masa?  Si  la  velocidad  de  un  pro- 
yectil se  puede  modelar  como  4^  para  tiempo  entre  t = Os  y t = ls, 
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¿cuánto  espacio  recorre  ese  proyectil  en  ese  tiempo?  Ambos  problemas 
pueden  enunciarse,  de  manera  impropia  como  dos  integrales: 

°°  f1  1 

e*2  dx,  / — - dt 
-00  Jo  yt 

y se  dice  que  de  manera  impropia  porque  en  el  primer  caso  el  intervalo 
de  integración  no  está  acotado  y en  el  segundo  la  función  no  está  aco- 
tada. Podrían  pasar  las  dos  cosas  a la  vez,  ojo. 

Hay  que  tener  en  cuenta  todos  los  casos  posibles.  Sean  a,  b G M U 
{— 00,  ex)}  dos  números  ó ±00  y sea  / una  función  / : X — > M donde 
X es  (a,  b ) salvo  un  número  finito  de  puntos  {pi, . . . , n}  (ordenados 
de  menor  a mayor).  Se  dice  que  pz  es  una  singularidad  de  / si  / no 
está  acotada  en  ningún  entorno  (p¿  — £,p.¿  + e).  La  expresión 

f(x)  dx 

se  llama  integral  impropia  de  primera  especie  de  f en  el  intervalo  (a,  b) 
si  a = — ex)  o b = +00  (o  ambos  a la  vez).  Si  ambos  a,  b e M son 
números,  entonces  la  expresión  se  llama  integral  impropia  de  segunda 
especia  de  f en  [ a,b ] si  / tiene  al  menos  una  singularidad  en  [a,  b\.  Si 
no,  se  llama  simplemente  integral  de  f (aunque  / no  sea  integrable,  por 
abuso  de  lenguaje). 


Definición  34.  Sea  b e M un  número  y / : ( — 00,  6]  una  función 
acotada.  Se  dice  que  / admite  integral  impropia  de  primera  especie  si 
existe  el  límite 


lím 

K — >—00 


f(x)  dx 


’K 


y,  caso  de  que  exista,  se  denota 


f(x)  dx. 


Si  en  lugar  de  b e M se  tiene  o 6 I y el  intervalo  es  [a,  00)  y / es 
acotada  en  [a,  00),  se  dice  igual  pero  para  este  intervalo. 


Cuando  los  dos  extremos  son  infinito  (uno  positivo  y otro  negativo), 
dividimos  el  intervalo  en  dos  partes: 


Definición  35.  Si  / : (— 00, 00)  — > M acotada  admite  integral 
impropia  de  primera  especie 


/ f(x)  dx 

J — OO 

si  para  cualquier  c6l  existen  los  límites 


r -M 


lím  / f(x)  dx,  lím  / f(x)  dx 
M^ooJc 

y la  integral  impropia  es  la  suma  de  ambos. 
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Por  otro  lado,  las  integrales  impropias  de  segunda  especie  se  estu- 
dian singularidad  a singularidad : 

Definición  36.  Sea  / : [a,  b]  — > M una  función  tal  que  b es  la  única 
singularidad  de  / (es  decir,  / no  está  acotada  en  ningún  entorno  de  b y 
esto  solo  pasa  en  b) . Se  dice  que  / admite  integral  impropia  de  segunda 
especie  por  b si  existe  el  límite 

pb—e 

lím  / f(x)  dx. 

e-*°+Ja 

Si  la  singularidad  es  a en  vez  de  b,  se  procede  de  modo  análogo.  Si  hay 
dos  singularidades,  se  divide  el  intervalo  en  dos  partes  y se  define  como 
la  suma  de  ambas  integrales  impropias. 


Si  / : [a,  b\  — > M tiene  varias  singularidades,  se  divide  todo  el  inter- 
valo [a,  b]  en  subintervalos  [a,p2],  ■ • • , \pn-i,b]  de  manera  que  en  cada 
intervalo  haya  singularidades  en  los  extremos  y se  suman  los  valores  de 
las  integrales  impropias  según  la  definición  36. 

Lo  siguiente  es  tan  sumamente  importante  que  posiblemente  caiga 
en  todos  los  exámenes,  por  eso  se  recuadra: 


De  esta  manera,  es  absurdo  el  siguiente  cálculo: 


/ — dx  = log(bl) 

Li  x 


= 0-0  = 0. 


-1 


porque  el  límite: 


[£  1 

lím  / — dx  = lím  log  \x\ 

e^O  J_1  X £—>0 


= lím  log  leí  = — oo 
-1  £ — >o 


no  existe  como  número  real  y por  tanto  la  integral  planteada  no 
está  definida , ni  siquiera  como  integral  impropia. 


5.1.  Convergencia  de  integrales  impropias.  Nos  interesamos 
ahora  por  estudiar  bajo  que  condiciones  se  puede  afirmar  que  una  inte- 
gral impropia  está  o no  definida.  Estudiamos  solamente  (como  es  lógico) 
los  casos  en  que  hay  una  impropiedad  (es  decir,  o bien  un  extremo  es 
infinito  o bien  hay  una  singularidad).  Comenzamos  por  las  de  primera 
especie  y nos  centramos  en  el  límite  +oo. 


Teorema  16.  * Sea  f : [a,  oo)  — > M una  función  real  positiva. 
Supongamos  que  existe  una  constante  M tal  que 

f{x)xQ  < M. 

Entonces:  si  a > 1,  la  integral  impropia 

f(x)  dx 

existe  (o  converge^.  Si  a < 1 entonces  la  integral  impropia  no  existe 
( no  converge ). 


Fixme:  Comprobar 
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En  concreto,  si  el  limite 

lím  f(x)xa 

ÍC— XX) 

existe  y es  finito  para  a > 1,  la  integral  converge.  Si  ocurre  para  a < 1 
y el  límite  no  es  0,  la  integral  diverge. 

La  condición  de  límite  distinto  de  0 en  el  segundo  párrafo  del  teore- 
ma es  esencial  (límite  0 con  o¿  > 1 no  dice  nada  sobre  la  convergencia). 

Para  entender  por  qué  el  teorema  es  cierto,  basta  comprobar  que  la 
integral  impropia 

x~a  dx 

converge  (existe)  si  a > 1 y diverge  (no  existe)  si  a < 1,  lo  cual  se  puede 
hacer  calculando  el  límite  aplicando  la  regla  de  Barrow  a la  primitiva. 
Para  las  integrales  impropias  de  segunda  especie,  pasa  justo  lo  dual: 

Teorema  17.  Sea  f : (a,  b\  — » M una  función  real  positiva  con  una 
singularidad  en  a.  Supongamos  que  existe  una  constante  M tal  que 

f(x)(x  — a)a  < M. 

Entonces:  si  a > 1,  la  integral  impropia 

f(x)  dx 

no  existe  (o  diverge,).  Si  a < 1 entonces  la  integral  impropia  existe 
( converge,). 

En  concreto,  si  el  límite 

lím  f(x)(x  — a)a 

x — >oo 

existe  y es  finito  para  a < 1,  la  integral  converge.  Si  ocurre  para  a > 1 
y el  límite  no  es  0,  la  integral  diverge. 

Para  entender  por  qué  el  teorema  es  cierto,  basta  comprobar  que  la 
integral  impropia 

i 

x~a  dx 

converge  (existe)  si  a < 1 y diverge  (no  existe)  si  a > 1,  lo  cual  se  puede 
hacer  calculando  el  límite  aplicando  la  regla  de  Barrow  a la  primitiva. 

6.  Integrales  paramétricas  y derivadas 

En  distintos  momentos  de  la  vida  (v.gr.  cuando  hay  que  utilizar 
la  Transformada  de  Laplace  o muchas  otras  transformadas)  aparecen 
funciones  que  se  calculan  como  integrales.  La  primitiva  de  una  función 
es  el  ejemplo  más  sencillo: 
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viene  definida  como  una  integral  diferente  para  cada  valor  de  x.  Hay 
otras  expresiones,  como 

poo 

F(x)  = / e-*^1  dtt 

Jo 

en  la  que  los  extremos  de  integración  no  varían  (de  hecho,  es  una  in- 
tegral impropia)  pero  sí  varía  la  función  que  se  integra  en  cada  x.  En 
realidad  esto  es  más  natural  de  lo  que  parece , pero  planteado  así  no  es 
nada  natural. 

De  todos  modos,  el  hecho  de  que  una  función  venga  definida  por 
una  integral  hace  posible  estudiarla : no  es  un  fastidio,  al  contrario,  de 
alguna  manera  permite  acercarse  a conocer  las  propiedades  de  dicha 
función.  Y las  propiedades,  como  hemos  visto  hasta  ahora,  se  estudian, 
principalmente,  derivando.  ¿Cómo  se  derivan  esas  funciones?  Con  cui- 
dado. 

Comencemos  con  un  ejemplo  más  o menos  físico. 

Ejemplo  2.  Se  tiene  una  plancha  bidimensional  de  un  material 
heterogéneo,  que  tiene  forma  rectangular  salvo  por  el  extremo  superior, 
que  se  ha  cortado  siguiendo  la  función  f(x)  = x 3,  donde  x denota  la 
disancia  en  horizontal  al  lado  izquierdo  de  la  plancha.  Se  sabe  que  la 
densidad  lineal  en  vertical  del  material  es  proporcional  a la  distancia  a 
la  base,  con  constante  de  proporcionalidad  k.  Se  van  a fabricar  varillas 
cortando  en  secciones  verticales  dicha  planta.  ¿Cómo  variará  la  masa 
de  las  varillas? 


El  enunciado  está  preparado  para  escribir  la  masa  de  una  varilla 


así: 


ft3 

m(t)  — I kxdx 
Jo 

El  hecho  de  que  el  extremo  superior  de  integración  sea  una  función  no 
complica  las  cosas.  Llámese  por  ejemplo  g(t)  = t3.  Está  claro  que  es 


m(t) 


r9(t) 


kx  dx. 


y no  es  más  que 


™(t)  = F(g(t)) 


poniendo 

pu 

F{u ) = / kxdx. 

Jo 

Si  ahora  queremos  derivar  m(t),  no  hay  más  que  aplicar  la  regla  de  la 
cadena: 

m'(t)  = g'(t)F\g(t ))  = 3 t2F\g{t)) 


pero  F{u)  es  una  función  definida  como  una  integral,  así  que  su  derivada 
es  el  integrando:  F'{u)  = ku.  Y como  hay  que  evaluarla  en  g{t ) = í3, 


60 


3.  CÁLCULO  INTEGRAL  DE  UNA  VARIABLE 


queda 

m\t)  = 3 t2F'(g(t))  = 3 t2k(t3)  = 3 t2kt3  = 3 kt5. 

A este  resultado  podíamos  haber  llegado  sin  tanto  lío,  calculando 


rí3 


m(t)  = 


kx  dx  = —x2 
2 


A 
2 ’ 


de  donde 

m'(t)  = 3í5. 

Pero  hay  momentos  en  la  vida  en  que  no  se  puede  integrar  tan  fácil- 
mente. . . y sin  embargo  sí  se  puede  derivar.  En  Wolframalpha  es  trivial: 


D(int(k  x,x,0,t~3) ,t) 


Una  función  que  no  se  puede  integrar  es  e x , pero  puede  formar 
parte  de  integrales  paramétricas: 


m = 


dx 


te 


(nótese  cómo  ahora  lo  que  cambia  no  es  el  intervalo  de  integración, 
sino  la  función  que  se  integra).  ¿Se  puede  derivar  F(t)l  Resulta  que 
sí  (luego  lo  enunciaremos),  pero  no  queda  algo  tan  evidente  como  antes 
(y  no  necesariamente  queda  algo  calculable).  Si  se  deja  x constante,  la 
función  integrando  es 

f(t)  = t2e~x2 

cuya  derivada  es  (la  variable  es  t,  la  x es  “constante”): 

f\t)=2te-x\ 


Pues  bien,  en  este  caso,  se  puede  demostrar  que 

/OO 

2 te~x2  dx. 

-OO 

Resumimos  los  resultados  en  los  enunciados  que  siguen: 

Sean  a(X),b(X)  dos  funciones  reales  de  variable  real  definidas  en 
un  intervalo  X C M.  Se  considera  una  función  f(x,X)  que,  para  cada 
A G X está  definida  y es  acotada  e integrable  en  [a(A),  b( A)].  Llamemos 

rK  A) 

I{X)  = / f(x,X)dx 

Ja{  A) 

a la  integral  dependiente  del  parámetro  A.  Queremos  calcular  su  deri- 
vada. 


Teorema  18.  En  las  condiciones  anteriores,  suponiendo  que  para 
cada  x la  función  f(x,  A)  es  derivable  con  respecto  a X y que  la  derivada 
es  acotada  e integrable  en  [a(A),6(A)j,  se  tiene  que 

rbW  f)f(T  \) 

/'(A)  = b\X)f(b(X),  A)  - a'(A)/(a(A),  A)  + / dx 

Ja(X)  ÜÁ 
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Nótese  que  si  los  extremos  de  integración  son  constantes,  los  dos  pri- 
meros términos  son  nulos  y desaparecen. 

En  general,  si  alguna  de  las  integrales  es  impropia,  no  se  puede  hacer 
salvo  que  se  cumplan  fuertes  condiciones  de  convergencia  en  las  que  no 
vamos  a entrar.  Sin  embargo,  si  estas  condiciones  se  dan,  el  enunciado 
sigue  siendo  cierto.  Esto  ese  lo  que  ocurre  en  la  transformada  de  Laplace 
de  funciones  mucho  más  pequeñas  que  ex  (subexponenciales). 


CAPITULO  4 


Sucesiones  y series  [...  de  funciones  también] 

Lo  que  nos  interesa  en  este  capítulo  es  acostumbrar  al  alumno  a la 
notación  de  sucesiones  y,  quizás  especialmente,  conseguir  que  entienda 
las  nociones  de  infinitos  e infinitésimos  equivalentes.  Intentaremos  que 
se  haga  algo  de  cargo  de  la  utilidad  del  concepto  de  límite  en  la  vida 
¿real?. 

El  desarrollo  de  la  sección  sobre  series  de  funciones  se  limita  a las 
series  de  potencias,  aunque  procuraremos  hablar  de  modo  lo  suficien- 
temente general,  al  menos  al  introducir  el  concepto,  que  permita  que 
entiendan  en  el  futuro  la  noción  de  serie  de  Fourier,  por  ejemplo. 

En  realidad,  casi  las  únicas  aplicaciones  de  las  sucesiones  y todo  esto 
es  verificar  que  los  cálculos  aproximados  que  se  realizan  siempre  (en 
la  vida  real)  tienen  una  justificación  e incluso  su  error  puede  acotarse 
con  precisión  (por  eso,  por  ejemplo,  se  sabe  que  e = 2,7182818+  o que 
7 r = 3,141592+  con  todas  las  cifras  “exactas”  (sin  redondeos). 

1.  Sucesiones 

La  noción  de  sucesión  refleja  la  idea  de  una  familia  de  números  en 
evolución.  No  es  más  que  eso: 

Definición  37.  Una  sucesión  de  elementos  de  un  conjunto  X es 
una  aplicación  an  : N — > X del  conjunto  de  números  naturales  en  el 
conjunto  X. 

Esa  definición  significa  literalmente  “una  familia  de  elementos  de 
X ordenada  como  el  primero,  el  segundo,  el  tercero, . . . ” . Cuando  X 
es  el  conjunto  de  números  reales,  X = M,  se  habla  de  sucesión  de 
números  reales  o sucesión  numérica  (en  estos  apuntes,  claro),  o sin 
más,  sucesión.  Cuando  se  habla  de  los  elementos  de  una  sucesión  en 
general,  se  habla  del  término  general. 

Ejemplo  3.  Varios  ejemplos: 

■ La  sucesión  constante:  c,  c,  c,  c, . . . , se  escribe  an  = c.  No  es  un 
número,  es  una  familia  de  números  iguales. 

■ La  sucesión  nula:  0,0,0,...,  an  = 0. 

■ La  sucesión  de  los  números  impares:  1,3,5,  7...,  su  término 
general  puede  escribirse  an  = 2n  — 1 (si  los  naturales  empiezan 
en  1,  cosa  “discutible”). 
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■ La  sucesión  de  los  pares:  0,2, 4,  6,...,  puede  escribirse  an  = 
2 (n  — 1),  o,  si  los  naturales  empiezan  en  0,  an  = 2 n.  Pero  hay 
que  especificarlo  antes  de  decir  nada. 

■ La  sucesión  de  los  primos:  2, 3,  5,  7, 11, 13, 17, ....  No  sé  conoce 
una  expresión  simplificada  para  ella.  Este  hecho  es  uno  de  los 
pilares  de  la  criptografía  moderna. 

■ La  sucesión  e7rn  comienza  con  e°  = 1,  y luego  ya  los  demás  son 
todos  raros:  e7r,  e27r,etc. . . 

■ La  sucesión  de  término  general  1/n  es  muy  importante  en  mu- 
chos casos. 

■ La  sueción  1, 1, 2,  3,  5,  8, 13, . . . de  números  de  Fibonacci  no  tie- 
ne una  expresión  sencilla,  salvo  que  an  = an_i  + an_2  para  n > 2 
y ai  = l,o2  = 1.  Se  dice  que  está  definida  por  recurrencia  (se 
recurre  (vuelve)  a los  términos  anteriores  para  calcular  el  pre- 
sente). 

■ En  la  vida  real,  uno  se  encuentra  con  la  sucesión  de  pagos  de 
una  hipoteca,  que  puede  ser  constante  o puede  ser  variable.  O 
con  la  sucesión  de  beneficios  de  unas  acciones.  O con  la  sucesión 
del  capital  acumulado  por  una  inversión  (digamos  en  acciones) 
a lo  largo  del  tiempo  (cada  mes  puede  actualizarse,  o cada  día). 

El  ejemplo  clave:  el  número  e. 


Ejemplo  4.  Lina  empresa  ofrece  préstamos  a un  año  a interés  com- 
puesto calculable  en  fracciones  de  distinto  periodo.  Por  ejemplo,  puede 
pedirse  un  préstamo  a un  interés  fijo  de  un  año,  o a un  interés  fijo 
mensual,  o a un  interés  fijo  diario,  o incluso  con  la  amortización  que  se 
quiera.  Si  el  interés  anual  es  r,  compruébese  que  el  capital  al  cabo  de 
un  año  en  un  préstamo  que  se  divide  en  n unidades  de  1/n  años  es 


K = C 


1+  - 

n 


donde  C es  el  capital  inicial. 

¿Qué  ocurre  cuando  se  divide  el  año  en  muchísimas  partes?  Resulta 
que  uno  tiene  que  preocuparse  por  la  sucesión  de  término  general 


— ( 1 H — 
n 


y estudiar  qué  pasa  si  n es  “gigantesco” . . . 

Lo  que  ocurre  es  que  esa  sucesión  se  aproxima  mucho  (cada  vez  más 
y todo  lo  que  uno  quiera)  a un  número  (que  depende  de  r,  claro):  er. 
Si  r = 1,  queda  e. 

Por  eso  en  los  mercados  de  valores  (especialmente  en  productos  de 
muy  alta  frecuencia  de  inversión)  en  lugar  de  calcularse  el  interés  por 
medio  del  polinomio  de  grado  n,  se  asume  que  el  tiempo  es  continuo  y 
se  calculan  los  intereses  como 


K = Cer, 
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que  es  el  limite  de  la  expresión  de  arriba  cuando  n es  muy  grande 
(imagínese  que  uno  actuliza  el  capital  cada  segundo,  por  ejemplo,  o 
cada  milisegundo). 

Las  sucesiones  1/n,  2 + , (l  + ^),!  tienen  algo  en  común  que 

es  difícil  de  expresar  de  otra  manera  que  con  la  definción  de  límite: 

Definición  38.  Una  sucesión  an  se  dice  que  tiene  límite  l € M si 
dada  cualquier  distancia  £ > 0,  existe  un  índice  n0  tal  que  an  — l < e 
para  cualquier  n > n0.  Se  indica 

lím  an  = l o bien  an  — » l. 

n— >00 

Es  decir,  una  sucesión  tiene  límite  l si  cualquiera  que  sea  la  distan- 
cia elegida  (por  pequeña  que  sea),  todos  los  términos  a partir  de  un 
momento  están  más  cerca  de  / que  esa  distancia. 

Así  pues,  la  sucesión  1,  0, 1,  0, 1,  0, . . . no  tiene  límite.  La  sucesión 
1,  2,  3, 4 . . . tampoco,  la  0,  0.1,  0.01,  0.001, . . . sí:  ¿cuál?  ¿por  qué? 

De  todos  modos,  hay  una  diferencia  entre  0, 1,  0, 1, . . . y 2, 4,  6,  8, ... : 
la  primera  no  va  a ninguna  parte  mientras  que  la  segunda  se  hace  cada 
vez  más  grande.  Esto  se  diferencia  con  la  noción  de  límite  infinito: 

Definición  39.  Se  dice  que  la  sucesión  an  tiene  por  límite  +oo  si 
dado  cualquier  M > 0,  a partir  de  un  término  no,  todos  los  an  son 
mayores  que  M.  Para  — oo  se  toma  M < 0 y an  < M. 

Eso  “normaliza”  el  tan  grande  como  se  quiera  a partir  de  un  mo- 
mento. Aun  así,  la  sucesión  1,  0,  2,  0,3,0,...  no  tiene  límite  oo,  obvia- 
mente, porque  aunque  muchos  términos  se  hacen  “muy  grandes” , no  lo 
hacen  todos. 

1.1.  Complejidad  - importante.  Algoritmos  de  ordenación  o 
de  búsqueda. 

Ejemplo  5.  El  problema  de  la  ordenación.  Se  tiene  una  colección 
de  n elementos  (por  ejemplo,  n transacciones  financieras,  esto  en  un 
mercado  de  valores  puede  ser  un  número  gigantesco)  y hay  que  ordenar- 
las (p.ej.  por  fecha).  Se  pueden  describir  dos  algoritmos  de  ordenación: 

Burbuja:  Se  compara  el  primero  con  el  segundo  y si  están  de- 
sordenados, se  intercambian.  Una  vez  hecho  esto,  se  compara 
el  segundo  con  el  tercero. . . Así  hasta  llegar  al  último.  En  esta 
primera  pasada,  el  último  es  el  mayor.  Se  apunta  como  el  mayor 
y se  repite  el  proceso  con  todos  menos  el  mayor. . . 

Mezcla:  Si  la  lista  tiene  0 ó 1 elementos,  está  ordenada.  Si  no, 
se  divide  la  lista  en  dos  partes  más  o menos  iguales.  Se  ordena 
cada  una  de  estas  partes  del  mismo  modo.  Al  final,  se  mezclan 
ordenadamente  las  dos  listas,  (¿alguien  lo  ha  entendido?). 
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¿Cuál  es  el  mejor  de  los  dos  algoritmos?  La  burbuja  necesita  unas  n2 
comparaciones,  la  mezcla  unas  n log(n):  ¿qué  es  mejor?  Pues  si  sabemos 
que 


lím 


n log(n) 
n2 


= 0, 


esto  quiere  decir  que  el  número  de  operaciones  qne  requiere  la  mezcla 
es  mucho  menor  que  el  que  requiere  la  burbuja.  Así  que,  en  principio, 
es  mejor  la  mezcla.  Discutir  esto  sería  importante:  ¿mejor  por 
qué?  ¿y  si  hay  limitaciones  de  memoria,  por  ejemplo? 


1.2.  Progresión  aritmética  y geométrica. 

Definición  40.  Una  sucesión  an  se  llama  progresión  aritmética  si 
la  diferencia  de  dos  elementos  sucesivos  es  una  constante:  an+i  — an  = c 
para  todo  n. 

Definición  41.  Lina  sucesión  an  se  llama  progresión  geométrica  si 
el  cociente  entre  dos  elementos  sucesivos  es  una  constante:  an+\/an  = c 
para  todo  n (o  bien  todos  los  elementos  son  0). 

Se  puede  calcular  con  una  sencilla  fórmula  la  suma  de  los  k prime- 
ros términos  de  una  progresión  aritmética  y el  producto  y la  suma  de 
los  k primeros  términos  de  una  progresión  geométrica.  Son  ejercicios 
interesantes,  hasta  cierto  punto. 

1.3.  Álgebra  de  límites. 

Teorema  19.  Si  an  — > a y f : M — > M es  continua  en  a entonces 

lím  f(an)  = /(a). 

n— >oo 

Demostración.  Obvio:  esto  es  exactamente  otra  manera  de  defi- 
nir la  noción  de  función  continua.  □ 

De  este  resultado  se  deduce  prácticamente  todo  lo  qne  sigue. 

Sean  an  y bn  dos  sucesiones  y supongamos  qne  ambas  tienen  límite 
finito,  an->ay  bn  —>  b. 


(an  + bn)  ->  a + b,  anbn  ->  ab,  ^ ->  j si  bn,  b^O, 

bn  b 

ab  si  an,  a /0,&n>  0,  log(an)  — > log(o)  si  an,  a > 0. 

1.4.  Órdenes  de  magnitud.  Muchas  veces  es  más  interesante 
la  noción  de  orden  de  magnitud  que  la  de  límite,  al  igual  que  muchas 
veces  es  más  interesante  acotar  qne  calcular  con  precisión  un  valor. 
Podríamos  hacer  el  estudio  todo  junto  (con  sucesiones  y límites  de  co- 
cientes, etc. . . ) pero  para  unificar  la  exposición,  hablaremos  de  órdenes 
de  infinitos  y órdenes  de  infinitésimos. 
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1.4-1-  Infinitésimos.  Se  dice  que  una  sucesión  an  es  un  infinitési- 
mo si  an  — > 0.  Fijemos  para  este  apartado  dos  infinitésimos  an  y bn. 
Del  mismo  modo  que  para  infinitésimos  de  funciones  (Definición  20), 
decimos  que  an  y bn  son 

Equivalentes:  si  f1-  — > 1. 

Del  mismo  orden:  si  Ia  — > r E R.  y r 0 (esto  incluye  que 
sean  equivalentes) . 

Por  otro  lado,  si  f21  — » 0 se  dice  que  an  es  de  orden  mayor  que  bn ; si 
Ia  — > oo,  [obviamente]  bn  es  de  orden  mayor  que  an.  Si  no  pasa  ninguna 
de  todas  estas  condiciones,  son  incomparables. 

El  orden  de  un  infinitésimo  indica  con  que  velocidad  se  acerca  a cero 
(relativamente  a otro  infinitésimo,  claro).  Si  an  es  de  mayor  orden  que 
bn,  es  porque  an  es  muchísimo  más  pequeño  que  bn  (siempre  para  n » 
0).  Son  equivalentes  si,  salvo  pequeñas  variaciones,  van  a la  misma 
velocidad.  Y son  del  mismo  orden  si  las  velocidades  son  comparables 
(el  cociente  “es  un  número  real”). 

Por  lo  general,  se  escribe  an  ~ o(bn)  si  an  es  de  orden  mayor  que  bn 
como  infinitésimo. 

1-4-2.  Infinitos.  Para  infinitos  se  dan  las  mismas  definiciones,  que 
no  son  más  que  la  traslación  a este  contexto  de  las  anteriores.  Supon- 
gamos que  an  y bn  tienen  ambas  límite  oo.  Se  dice  que  son 


Equivalentes:  si  y-  — »•  1. 

Del  mismo  orden:  Si  ^ — > r G M y r 0 (esto  incluye  que 
sean  equivalentes) . 

Por  otro  lado,  si  ^ — > 0 se  dice  que  bn  es  de  orden  mayor  que  an. 

Si  — > oo;  [obviamente]  an  es  de  orden  mayor  que  bn.  Si  no  pasa 
ninguna  de  todas  estas  cosas,  son  incomparables. 

Téngase  en  cuenta  que,  como  se  están  mirando  las  cosas  “en  la 
dirección  contraria”,  la  noción  de  mayor  orden  corresponde  al  que  va 
más  rápido  hacia  +oo. 

La  notación  clásica  es  an  ~ 0(bn)  cuando  an  y bn  son  del  mismo 
orden.  Aunque  esto  difiere.  Desde  luego,  si  son  del  mismo  orden,  esta 
notación  es  correcta. 

Por  lo  general,  interesa  acotar  el  orden  de  magnitud  de  los  infinitos, 
más  que  nada  para  hacerse  una  idea.  El  problema  del  tiempo  polinomial 
para  llevar  a cabo  un  algoritmo. 


1.5.  Cálculo  de  límites:  “trucos”.  Espero  que  quede  claro. 

Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los 
límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en 
general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se 
calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
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o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
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en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
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ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites, 
en  general,  se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general, 
se  calculan  con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan 
con  un  ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un 
ordenador  o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador 
o usando  Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando 
Internet.  Los  límites,  en  general,  se  calculan  con  un  ordenador  o usando  Internet. 
El  siguiente  comando  en  wolframalpha.com: 

lim(sin(n) *log(n) / sqrt (n) ,n, inf ) 

calcula  el  límite  de  la  sucesión  qUe  es  o.  Lo  podéis  probar 

con  vuestro  teléfono  móvil. 

Solo  los  límites  de  sucesiones  que  no  se  pueden  escribir  como  fun- 
ciones conocidas  puede  que  requieran  cálculos  a mano  previos  a intro- 
ducirlos en  un  ordenador. 

Antes  de  seguir,  generalizamos  la  noción  de  equivalencia  a cualquier 
par  de  sucesiones: 


Definición  42.  Dos  sucesiones  an  y bn  son  equivalentes  si 

■ O son  ambas  infinitos  o infinitésimos  equivalentes,  o bien 

■ Existe  el  límite  del  cociente  y es  1:  lím  Ia  = l1. 


Como  se  ha  visto  antes  (Teorema  19),  las  funciones  continuas  per- 
miten sustituir  el  límite  de  una  sucesión  en  el  punto  para  calcular  el 
límite  de  una  función  de  una  sucesión.  De  este  modo,  es  obvio  que: 

1.  Si  P(n)  y Q(n)  son  dos  polinomios  y sus  términos  de  mayor 
grado  son  pmnm  y qrnr , entonces: 


lím 


P(n ) 

Q{n) 


lím 


Pmnm 

qrnr 


l 


donde  l es: 

■ 0 si  m < r, 

■ Pm/qr  si  m = r, 

■ oo  si  m > r. 


1Esto  requiere  que  bn  ^ 0 para  n » 0,  lo  cual  siempre  se  supondrá  cuando  se 
use  esta  noción 
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2.  Criterio  del  cociente:  Si  existe  lím  y an  es  de  términos 

an  J n 

positivos,  entonces 

lím  "+1  = lím  sfaf. 

&n 

3.  Si  an  y bn  son  dos  sucesiones  equivalentes  con  límite  l y f(x)  es 
una  función  continua  en  l,  entonces 

lím  f(an)  = lím  f(bn). 

4.  Si  an  y bn  son  dos  sucesiones  equivalentes  y cn  es  otra  suce- 
sión, entonces:  si  uno  de  los  miembros  de  cada  igualdad  existe, 
entonces  existe  el  otro  y se  da  la  igualdad 

lím  ancn  = lím  bncn , lím  — = lím  -4 2 

dn  bn 


1.5.1.  Casos  “indeterminados”.  Todos  estos  casos  deberían  ser 
bien  conocidos  y vamos  a pasar  por  ellos  rapidísimamente. 

El  caso  [j:  se  da,  obviamente,  cuando  se  divide  un  infinitésimo  entre 
otro.  Por  lo  general,  todos  estos  se  resuelven  utilizando  desarrollos  de 
Taylor  (u  otros  desarrollos)  de  las  funciones  que  definen  las  sucesiones 
cerca  de  0.  Es  decir,  hace  falta  conocer  el  desarrollo  de  Taylor  de  las 
funciones  más  importantes. 

Bueno,  en  realidad  no  hace  falta  conocerlos:  lo  que  hace  falta  es 
saber  cómo  se  calcula:  derivando. . . 

Y,  por  otro  lado,  tener  clara  la  siguiente  tabla  de  órdenes  infinite- 
simales (donde  c > 1),  de  izquierda  a derecha  van  de  menor  a mayor 
orden  (es  decir,  la  división  de  uno  de  la  izquierda  por  uno  de  la  derecha 
tiene  por  límite  0): 


El  Polinomio  de  Taylor  es  crucial  para  este  caso: 

Lema  15.  Si  f(x ) continua  y nula  en  0 tiene  desarrollo  de  Ma- 
cLaurin  P(x ) = pkXk  + . . . , con  Pkfi  0 (es  decir,  si  su  desarrollo  no  es 
nulo),  entonces,  para  cualquier  infinitésimo  an,  se  tiene  que 

fM  ~ Pkak. 

(Es  decir,  una  función  infinitesimal  es  “equivalente  a su  desarrollo  de 
MacLaurin” , si  este  es  no  nulo). 

Nótese  que  la  clásica  función 

f(x)  = e~^  si  x 0,  /(O)  = 0 

2Para  lo  cual  se  requiere  que  tanto  an  como  bn  sean  no  nulos  para  n suficien- 
temente grande. 
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no  cumple  la  condición  del  lema  porque  su  desarrollo  de  MacLaurin  es 

0. 

Téngase  en  cuenta  que,  casi  seguro  un  límite  que  aparece  como  jj  se 
podrá  calcular  utilizando  la  regla  de  L’Hópital,  salvo  que  alguna  de  las 
sucesiones  contenga  “términos  trigonométricos  oscilantes”  (i.e.  alguna 
de  ellas  oscila). 

El  caso  Se  pueden  hacer  dos  cosas:  convertirlo  en  j)  o bien  utilizar 
órdenes  de  magnitud  de  infinitos. 

Los  órdenes  de  magnitud  de  infinitos  son  de  la  misma  naturaleza 
que  los  de  los  infinitésimos  (como  arriba,  c > 0): 


(6) 


La  fórmula  de  Stirling:  Lina  de  las  equivalencias  de  infinitos 
más  importantes  que  se  ha  probado  es  la  fórmula  de  Stirling.  Es  más 
o menos  “mágica”,  aunque  tiene  su  razón  de  ser.  Esta  es  una  de  las 
pocas  que  hay  que  saberse  de  memoria: 

n\  ~ nne~nV‘27rn. 


log(n) 

nc 

cn 

n\ 

n11 

Conviene  acostumbrarse  a calcular  límites  sustituyendo  infinitési- 
mos e infinitos  por  sus  equivalencias  (p.ej.  “quitando”  términos  de  or- 
den menor,  que  pueden  ser  irrelevantes  para  el  cálculo  del  límite,  si  es 
que  aparecen  sumandos,  etc. . . ). 

Otras  indeterminaciones.  Las  formas 

0 ■ oo,  oo  — oo,  1°°,  0o,  oo° 


se  reducen  todas  a las  ya  estudiadas,  utilizando  las  siguientes  igualdades 
(donde  el  logaritmo,  es  siempre  el  natural): 


ab 


u, 

Vi’  °~b 


i _ i 

b a ab  _ eb  log(o) 

ab 


y,  muchas  veces,  como  log(l  + x)  = x,  si  an  — > 1,  los  límites  1°°  pueden 
ponerse  (se  supone  bn  — > oo): 


aín  ~ e^On-L 


con  lo  que  solo  hay  que  calcular  el  límite  de  bn(an  — 1). 

Pero  todo  lo  dicho  hay  que  explicarlo  en  los  exámenes,  no  vale  “apli- 
car la  fórmula  sin  más” . 


1.6.  Criterio  de  Stolz.  Llegamos  al  último  (y  quizás  el  único 
relevante  porque  es  de  los  únicos  que  aun  no  están  implementados  en 
los  sistemas  de  computación  simbólica).  Es  el  equivalente  a la  regla  de 
L’Hópital  en  sucesiones: 
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Teorema  20  (Criterio  de  Stolz).  Sean  an  y bn  dos  sucesiones  de 
números  reales  tales  que  bn  es  monótona,  no  tiene  elementos  iguales  a 
cero  y 

■ O bien  bn  es  divergente 

■ O bien  an  y bn  convergen  ambas  a 0. 

Entonces,  si  existe  el  límite 


lím 


®n+ 1 + 

bn+1  bn 


existe  también  el  límite  lím  f22-,  y ambos  coinciden. 

On 


Este  resultado  se  “utiliza”  para  calcular  límites  de  expresiones  con 
sumas,  por  lo  general: 

„ 1 + 2 + ■■■  + n 

lim 

nz 

(si  uno  no  sabe  que  1 + ••■  + «,  = n(n  + l)/2,  se  puede  hacer): 

an  = 1 H b n,  bn  = n 2 


cumplen  las  condiciones  del  criterio  de  Stolz,  así  que  calculamos 
an+i  - an  n + 1 n + 1 1 

lili = = lím = — . 

bn+1-bn  (n  + l)2  — n2  2n  + 1 2 

De  donde  el  límite  original  es  1/2,  también. 
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Ejemplo  6.  Se  sabe  que  un  satélite  emite  a cada  paso  por  el  punto 
de  contacto  la  mitad  de  la  energía  qne  en  el  paso  anterior.  La  primera 
vez  emitió  lOOj.  ¿Cuánta  energía  emitirá  como  mucho,  en  total,  al  cabo 
de  toda  su  vida? 


Este  ejemplo  es  el  clásico  problema  en  qne  aparece,  de  manera  na- 
tural, una  sucesión  cuyo  término  general  es  una  suma.  Si  la  energía  en 
el  paso  k es  a*,,  entonces  la  energía  acumulada  es 

n 

En  ai  + • • • + an  ^ ^ 

k= i 


y el  enunciado  pide  calcular  (o  al  menos  acotar  inferiormente) 


lím  En 

n— >oo 


n 

lím  i 

n— >oo  ' J 
k= 1 


Definición  43.  Una  sucesión  cuyo  término  general  es  una  suma 
de  n términos  se  llama  serie  y se  expresa 

OO 

£«n. 

n= 1 
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Lo  cual  no  significa  que  se  realice  una  suma  infinita.  Es  una  manera 
breve  de  escribir  la  sucesión 


En  — (ai  + • • • + an). 


Continuando  con  el  ejemplo,  se  tiene  que  ai  = 100  j y se  sabe  que 
a„  = \an- 1,  para  n > 1,  de  manera  que  es: 


E„ 


100  + 


100 
2n~1 ' 


(cuidado  con  el  último  exponente,  es  n - 1,  no  n).  La  sucesión  En  se 
escribe 


OO 

^ Cln 

n=  1 


E 

71=1 


100 

2n~1’ 


que  es  (como  todo  el  mundo  sabe)  la  sucesión  correspondiente  a la 
suma  de  términos  de  una  progresión  geométrica: 


_ ai  - anr  _ 100  - ^ 
1 - r 1 - | 


Calcular  el  límite  de  esta  sucesión  En  (que  es  una  serie)  es  sencillo,  da: 
200. 

Esto  también  se  escribe 


^ ~ 100 

yy  ~ yz  2*1-1  _ 

71=1  71=1 


pero  solo  es  una  notación:  no  significa  que  “la  suma  infinita  dé  200” 
porque  no  sabemos  hacer  sumas  infinitas.  Simplemente  indicamos  que 
la  sucesión  de  sumas  de  n términos  de  la  progresión  tiene  como 
límite  200. 


Definición  44.  Sea  S una  serie  numérica 

OO 

S = ^an 

71=1 

de  término  general  an.  Sea  Sn  = Y^¡=  i an  Ia  suma  n— ésima.  Se  dice  que 
S es 

Convergente:  Si  la  sucesión  Sn  converge. 

Divergente:  Si  la  sucesión  Sn  no  converge. 

Por  otro  lado,  se  dice  que  es  oscilante  si  el  término  general  an  cambia 
de  signo  cada  vez.  Además,  se  dice  que  S es  absolutamente  convergente 
si  la  serie  S'  = ^ |a„,|  cuyo  término  general  es  el  valor  absoluto  de  an 
converge. 

Finalmente,  si  S converge  pero  no  absolutamente,  se  dice  que  S es 
condicionalmente  convergente  (desafortunada  nomenclatura). 
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Si  S converge,  el  límite  al  que  converge  se  llama  suma  de  la  serie 
S. 

Se  tienen  los  siguientes  resultados,  si  S = an  es  una  serie  de 
término  general  an: 

Lema  16.  Si  S converge,  entonces  an  — > 0. 

Demostración.  Debería  ser  capaz  de  hacerla  cualquiera.  □ 

Lema  17.  Si  S es  absolutamente  convergente,  entonces  S es  con- 
vergente. 

Demostración.  Debería  ser  sencillo,  pues  cada  vez  se  suma  menos 
que  lo  que  suma  la  serie  de  valores  absolutos  y si  esta  converge,  la  otra 
debería  hacerlo. . . □ 

Lema  18  (Criterio  de  Leibniz).  Si  S es  oscilante  (es  decir,  el  signo 
de  an  es  el  contrario  del  de  an+í)  y an  — ► 0,  entonces  S converge. 

Demostración.  Esto  es  lo  que  debería  ser  más  fácil  de  probar.  □ 

El  problema  de  las  series  que  no  son  absolutamente  convergentes  es 
que  no  se  pueden  reordenar  los  términos.  Por  ejemplo,  la  serie 

- l)n 


s = £ 

71=  1 


n 


es  oscilante.  El  término  general  converge  a 0,  así  que  S tiene  suma  finita 
¿cuál?  Tiene  que  ver  con  el  logaritmo. . . Sin  embargo,  si  uno  intenta 
decir  “primero  sumo  los  positivos”  y “luego  sumo  los  negativos”,  es 
decir: 

OO  1 OC 

Sl=^2n’  = 

TI—  1 71=1 

y calcular  la  suma  de  S como  la  suma  de  Si  menos  la  suma  de  S2, 
resulta  que  está  cometiendo  un  abuso,  pues  ninguna  de  las  dos  series 
Si  ni  S2  converge,  con  lo  que  la  resta  de  sus  sumas  no  tiene  significado 

Lema  19  (La  serie  armónica) . La  serie  de  término  general  \ .• 

■ Converge  si  a > 1. 

■ Diverge  si  a < 1. 

Se  llama  serie  armónica. 

Demostración.  No  vamos  a hacerla  en  detalle,  pero  es  muy  senci- 
llo probarlo  utilizando  el  criterio  de  Cauchy  (sin  decir  que  es  “el  criterio 
de  Cauchy”):  acotar  las  sumas  2n— ésirnas,  unas  por  arriba  y otras  por 
abajo,  etc. . . □ 

La  herramienta  fundamental  para  estudiar  el  carácter  de  una  serie 
es  el  siguiente  lemma 

Lema  20.  Sea  S = J2an  una  serie  de  términos  positivos  y sea 
T = otra,  también  de  términos  positivos. 
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■ Si  bn  < an  y T diverge,  entonces  S diverge. 

■ Si  an  <bn  y T converge,  entonces  S converge. 

Se  supone  que  las  desigualdades  son  ciertas  a partir  de  un  cierto  n0. 

Demostración.  Obvio:  debería  serlo  a estas  alturas  de  curso.  □ 
Con  este  resultado  en  la  mano,  se  tiene: 

Corolario  1 (Comparación  con  la  serie  armónica).  Sea  S = ^ an 
una  serie  de  términos  positivos.  Entonces 

■ Si  an  < para  algún  a > 1,  entonces  S converge. 

■ Si  an  > -C  para  algún  0 < a < 1,  entonces  S diverge. 

Se  supone  que  las  desigualdades  son  ciertas  a partir  de  un  cierto  n0. 

Demostración.  No  hay  más  que  utilizar  el  criterio  de  la  serie 
mayorante  o minorante  una  vez  que  se  conoce  el  carácter  de  la  serie 
armónica.  □ 

Un  resultado  un  poco  más  elaborado  y posiblemente  fácil  de  usar 
es  el  criterio  de  Pringsheim: 

Lema  21.  Sea  S = ^an  una  serie  de  términos  positivos.  Supon- 
gamos que  para  cierto  a > 0,  existe  el  límite 

lím  anna  = l. 

n— >oo 

Entonces: 

■ SIéKi/I/0,  la  serie  S tiene  el  mismo  carácter  que  la  serie 
armónica  de  exponente  a. 

■ Si  l — 0 y a > 1,  la  serie  S converge. 

■ Si  l — oo  y a < 1,  la  serie  S diverge. 

Darnos  los  otros  dos  criterios  más  conocidos: 


Lema  22.  Si  S 
tiene  que 

entonces: 


an  es  una  serie  de  términos  positivos  y se 


lím  "+1  = ÍE®, 


■ Sil  <1,  la  serie  S converge. 

■ Sil  > 1,  la  serie  S diverge. 

■ Sil  = 1,  no  se  sabe. 


Lema  23.  Si  S = an  es  una  serie  de  términos  positivos  y se 
tiene  que 

lím  = l G M, 

entonces 


■ Si  l < 1 la  serie  S converge. 

■ Sil  > 1,  la  serie  S diverge. 

■ Sil  = 1,  no  se  sabe. 
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En  general,  es  mejor  acudir  a un  ordenador  que  hacer  las  cuentas 
a mano.  El  siguiente  comando  en  wolframalpha 


sum(n~n/(2n+l) ~n,n, 1 , inf ) 


muestra  que  la  serie 


E 


n 


^ (2 n + l)n 

2=1  v 7 

converge  (por  el  criterio  del  cociente)  y da  una  suma  aproximada. . . 

Definición  45.  Sea  S = an  una  serie  convergente  de  suma  s. 
Se  llama  resto  n—ésimo  a la  diferencia: 

n 

Rn  S ^ ^ íln  j 
k= 1 

que,  obviamente,  es  una  sucesión  que  converge  a 0. 


Lo  que  “se  hace”  en  la  vida  real  es  calcular  la  suma  n-ésima  y acotar 
el  resto  n—ésimo  para  saber  con  “cuánto  se  acerca  uno  al  resultado  de 
la  suma” . 


Definición  46.  La  constante  de  Euler  (o  de  Euler-Mascheroni)  es 
el  siguiente  límite: 


lím 

n— >oo 


log(n)  - 


k= 1 


~ 0,57721+ 


“La  serie  armónica  diverge  como  el  logaritmo  más  la  constante  de  Eu- 
ler”, se  podría  decir. 


3.  Series  de  potencias 

Fijémonos  en  la  Figura  1.  Representa  (en  negro)  la  función  sen(x) 
en  el  intervalo  [—4,4],  aprox.  y,  en  distintos  colores,  las  gráficas  de  los 
polinomios  de  Taylor  de  la  función  sen(x)  de  grados  1,  3,  5 y 7. 


Figura  1 . Polinomios  de  Taylor  sucesivos 
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El  lector  observará  que,  según  aumenta  el  grado  del  polinomio,  su 
gráfica  “se  acerca  más”  a la  de  la  función  seno.  El  polinomio  de  grado 
uno  es  una  recta  que  en  seguida  se  aleja  de  la  gráfica  sinusoidal,  el  de 
grado  3 tiene  los  extremos  más  cerca  de  los  primeros  extremos  de  la 
función  seno,  pero  en  seguida  se  “va  lejos”,  hasta  que  el  de  grado  7 
está,  en  la  zona  visible  de  la  gráfica,  muy  cerca  de  la  función  seno. 

El  polinomio  de  Taylor  de  la  función  seno  cada  vez  se  parece  más  a la 
propia  función  seno,  según  aumenta  su  grado.  Claro  que,  según  aumenta 
el  grado,  se  convierte  en  una  suma  cada  vez  más  grande. . . Esto  nos  hace 
pensar  en  la  posibilidad  de  escribir  una  serie  no  ya  numérica,  sino  con 
x. 

Definición  47.  Una  sucesión  de  funciones  es  una  familia  fn  de 
funciones  reales  de  variable  real,  una  para  cada  n e N. 

Definición  48.  Una  serie  de  potencias  S(x)  es  una  sucesión  de  fun- 
ciones cuyo  término  general  es  un  polinomio  de  grado  n.  Si  el  término 
general  se  escribe  como  un  polinomio  en  (x  — a),  donde  a es  un  número 
real,  se  dice  que  S(x)  está  centrada  en  a.  Se  escribe  siempre 

OO 

S(x)  = an{x  — a)n. 

n= 0 

Por  lo  general,  se  toma  la  suma  comenzando  en  0. 

Está  claro  que  un  polinomio  siempre  define  una  función  en  todo  M, 
pero  ¿una  serie  de  potencias?  Podría  perfectamente  ocurrir  que  “sus- 
tituir la  x por  un  valor”  no  tuviera  sentido.  Por  ejemplo,  si  en  la  serie 
de  potencias 

OO 

S(x)  = J2x" 

71= 0 

(centrada  en  0)  sustituimos  la  x por  x — 1,  queda 

OO 

s(  i)  = £! 

n= 0 

que,  obviamente , no  tiene  sentido  como  número  real  (la  serie  que  apa- 
rece es  divergente).  Pues  bien,  con  las  series  de  potencias  ocurre  algo 
especial,  que  es  parte  de  la  clave  de  su  importancia:  si  la  sustitución 
converge  para  un  cierto  número  positivo,  entonces  converge  para  todos 
los  que  tienen  valor  absoluto  menor  o igual  que  ese  número. 

Teorema  21.  Sea  S(x)  una  serie  de  potencias  ceiitrada  en  a,  es 
decir: 

OO 

S(x)  = an{x  — a)n. 

n=0 

Si  S(a+r ) — es  decir,  la  serie  cuyo  término  general  es  an(r)n — conver- 
ge para  cierto  r > 0,  entonces  S(x)  converge  para  todo  x G [ a — r , a + r). 
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De  aquí  que  tenga  sentido  definir 

Definición  49.  Dada  una  serie  de  potencias  S(x)  centrada  en  a, 
se  define  el  radio  de  convergencia  de  S(x)  como  el  sumpremo  de  los  r 
tales  que  S(a  + r)  converge.  Si  ese  supremo  es  +oo,  entonces  se  dice 
que  S(x)  tiene  radio  de  convergencia  infinito. 

El  radio  de  convergencia  es  “sencillo”  de  calcular: 

Lema  24.  El  radio  de  convergencia  de  S(x)  = ^2an(x  — a)n  es 


Lo  que  indica  el  radio  de  convergencia,  a efectos  prácticos,  es  el 
intervalo  alrededor  de  a en  cual  tiene  sentido  sumar  la  serie  S(x). 

Pero  las  series  de  potencias  son  útiles  sobre  todo  porque  permiten 
aproximar  las  funciones  que  tienen  infinitas  derivadas,  en  casos  comu- 
nes. 


Definición  50  (Serie  de  Taylor).  Sea  / : X — > R una  función  real 
de  variable  real  que  tiene  derivadas  de  todos  los  órdenes  en  el  punto 
a G 1.  Se  denomina  serie  de  Taylor  de  f en  a & la  serie 


00  f{n)(  \ 

S(x)  = m (x  ~ a)n’ 


n= 0 


ni 


que  no  es  más  que  “el  polinomio  de  Taylor  llevado  al  límite”. 


Si  a = 0 (es  decir,  se  hace  el  desarrollo  en  0),  hay  gente  que  lo  llama 
desarrollo  de  MacLaurin.  Yo  no,  siempre  diré  Taylor. 

Está  claro  que  para  cada  x,  la  serie  de  Taylor  define  una  serie 
numérica.  Lo  que  no  está  tan  claro  es  que  esa  serie  numérica  converja. 
Lo  hace  en  el  radio  de  convergencia: 


Nota  6.  La  serie  de  Taylor  S{x)  de  una  función  f(x)  en  0 defi- 
ne otra  función  en  un  intervalo  ( a — r,  a + r),  donde  r es  el  radio  de 
convergencia  de  S(x). 


El  caso  es  que  puede  que  la  serie  de  Taylor  no  defina  la  misma 
función  que  /. 


Nota  7.  Sea  f(x)  una  función  con  derivadas  de  todos  los  órdenes 
y S(x)  = an(x  — a)n  su  desarrollo  de  Taylor  en  a.  Se  define  el  resto 
n-ésimo  de  S(x)  como 

n 

Rn{x)  = f{x)  - an{x  - a)n. 

k= 0 

Está  claro  que  la  serie  S(x)  tiene  como  suma  f(x)  en  el  punto  a;  si  y 
solo  si  Rn(x)  converge  a 0 en  ese  punto. 
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Como  con  el  Polinomio  de  Taylor,  si  se  tiene  lina  cota  para  la  deri- 
vada n— ésima,  se  tiene  una  cota  para  el  error,  pues  el  resto  n— ésimo 
de  la  serie  es  lo  mismo  que  el  error  cometido  por  el  polinomio  de  Taylor 
de  grado  n. 

Recordamos  la  primera  cota  del  error  del  polinomio  de  Tyalor:  Teo- 
rema 10: 


Teorema  22  (Cota  del  error  con  la  derivada).  Si  f es  una  función 
con  derivadas  de  todos  los  órdenes  en  (a  — e,  a+e)  y S(x ) es  su  serie  de 
Taylor  en  a y se  tiene  que  |/^n+1^(a;)|  < M en  el  intervalo  (a  — £,a  + e), 
entonces 

\Rn(x)\  < .M|a;  - a\n+l, 

( n + 1)! 

es  decir,  el  error  n— ésimo  es  más  pequeño  que  esa  cota. 


Lo  que  puede  ocurrir  es  que  no  se  tenga  esa  cota  en  el  intervalo. 
Por  ejemplo,  la  función 

f(x)  = e~^  si  x 0,  /(O)  = 0 

es  (como  se  puede  comprobar)  derivable  infinitas  veces  en  todo  M.  El 
valor  de  la  derivada  de  cualquier  orden  en  0 es  0,  así  que  la  serie  de 
Taylor  de  f(x)  en  0 es 


s (*)  E fpx 


n= 0 


o. 


Esta  serie  converge  independientemente  del  valor  de  x (siempre  suma 
0),  y por  tanto  define  una  función.  Como  es  obvio,  la  función  constan- 
temente igual  a 0 no  es  la  función  f(x)  (cuya  gráfica  se  puede  ver). 
¿Qué  ocurre  en  este  caso  para  que  la  serie  de  Taylor  sea  tan  diferente 
de  la  función?  Que  las  derivadas  de  órdenes  sucesivos  se  van  haciendo 

muy  grandes  y los  restos  n— ésirnos  son  también  grandes,  por  tanto. 

-1 

Así  pues,  la  serie  de  Taylor  de  es  inútil  para  aproximar  los 
valores  de  la  función,  porque  el  resto  n— ésimo  es,  en  este  caso,  igual  a 
la  función. 

La  otra  posible  pega  de  los  desarrollos  de  Taylor  es  que  puede  que 
la  serie  tenga  radio  de  convergencia  nulo. 


EJEMPLO  7.  Supongamos  que  una  función  f(x)  cumple  la  condición 
siguiente 

x2f\x)  - f{x)  = 1 

que,  por  razones  obvias,  se  denomina  ecuación  diferencial,  y además, 
/(0)  = 0.  (Se  sabe  que  esta  f(x)  existe).  Si  se  calcula  su  serie  de  Taylor 
S(x)  en  0,  a partir  de  la  ecuación  propuesta  sale 

OO 

S(x)  = y^(n  — l)!a;n 

71—1 
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2 


0 


-2 


-1  -0,5  0 0,5  1 

— 1 

Figura  2.  La  función  e^1  y sus  derivadas. 

y,  como  todo  el  mundo  sabe, 

lím  \J [n  — 1)!  = oo, 

n— >oo 

de  donde  el  radio  de  convergencia  es  0.  Es  decir,  si  xq  > 0,  la  serie  que 
se  obtiene  al  sustituir  x por  x0  es  divergente  y por  tanto,  no  se  puede 
decir  que  la  serie  de  Taylor  defina  una  función. 

Así  pues,  una  vez  calculada  la  serie  de  Taylor  de  una  función  f(x), 
para  poder  usarla  como  aproximación  de  f(x)  es  necesario  comprobar 
que  el  radio  de  convergencia  es  positivo  y que  el  resto  n— ésimo  converge 
a 0 en  todo  el  intervalo  de  manera  uniforme. 

Se  sabe  algo,  pero  no  mucho.  Para  la  convergencia  de  la  serie  a una 
suma  finita  en  cada  punto  de  un  intervalo: 

Definición  51.  Sea  S(x)  una  serie  de  potencias 

OO 

S(x)  = ^2an(x  - a)n 

n= 0 

y sea  r > 0 un  número  positivo.  Se  dice  que  S(x)  converge  uniforme- 
mente en  [a  — r,a  + r]  si  para  cualquier  e > 0 existe  no  tal  que 

\Rn(x)\  < £ 

cuando  n > no  independientemente  de  x 6 [a  — r,a  + r]. 

Por  ejemplo: 

Lema  25.  Si  S(x)  es  una  serie  de  potencias 

OO 

S(x ) = an{x  — a)n 

72—0 

y existe  M > 0 tal  que  \an\  < M a partir  de  no,  entonces  S(x)  converge 
uniformemente  en  cualquier  intervalo  [a  — r,a  + r\. 
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Pero,  repito,  que  la  serie  de  Taylor  converja  uniformemente  no  quie- 
re decir  qne  converja  uniformemente  a la  función.  Eso  sí,  si  las  derivadas 
son  suficientemente  pequeñas,  sí  qne  lo  hace: 


Lema  26.  Si  f{x ) es  una  función  que  admite  todas  las  derivadas 
en  a y S(x)  es  su  serie  de  Taylor  en  a: 


n=0 

y se  sabe  que  existe  M > 0 


OO  r(n)(  \ 

s(x ) = 

n=0 


tal  que 


para  todo  n > no  y para  todo  x G [a  — r,  a + r],  entonces  la  serie  de 
Taylor  converge  a la  función  f(x)  en  todos  los  puntos  de  [a  — r,  a + r] . 


Por  ejemplo,  esto  ocurre  con  las  funciones  sen(a;),  cos(a;),  exp(x)  pa- 
ra a = 0 y cualquier  r. 

Nota:  El  desarrollo  de  Taylor  de  una  función  en  0 suele  denominar- 
se, por  motivos  históricos,  desarrollo  de  MacLaurin,  pero  intentaré  no 
hacerlo  nunca  para  evitar  líos. 


4.  Derivación  e integración  de  series  de  potencias 

Cuando  una  serie  de  potencias  define  una  función  en  un  intervalo 
(es  decir,  cuando  su  radio  de  convergencia  es  positivo),  ¿cómo  se  puede 
calcular  la  derivada  de  la  función  qne  define?  ¿la  primitiva?  Pnes  igual 
que  con  polinomios,  haciéndolo  término  a término. 

Teorema  23.  Sea  S(x)  = an(x  — a)n  una  serie  de  potencias 
centrada  en  a,  con  radio  de  convergencia  r.  Entonces: 

■ La  función  definida  por  S(x)  en  ( a — r,a  + r)  es  derivable,  y el 
desarrollo  de  Taylor  de  la  derivada  es 

OO 

Si(x)  = nan{x  — a)n. 

n=  1 

Además,  este  desarrollo  converge  a la  función  derivada:  Si(x)  — > 
S'(x)  uniformemente  en  (a  — e,  a + e)  para  0 < e <r. 

■ La  función  definida  por  S(x)  en  (a  — r,  a + r)  es  integrable,  el 
desarrollo  de  Taylor  de  una  primitiva  en  a es 

OO  1 

s2(x)  = — —an(x  - a)n+1 

n + 1 

TI—  1 

y además,  este  desarrollo  converge  a la  primitiva  de  S{x)  que 
vale  0 en  a: 

S\(x)  — > / S{x)dx 

J a 

uniformemente  en  (a  — e,  a + e)  para  0 < e <r. 
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La  frase  “uniformemente  en  ...  ” debe  entenderse  como  “sin  pro- 
blemas mayores  en  todo  el  intervalo  (a  — r,  a + r)” , pero  está  así  dicho 
con  precisión. 


CAPITULO  5 


Cálculo  [diferencial]  en  varias  variables 

Time  for  a break. 

Esto  es  difícil.  Honradamente,  solo  aspiro  a que  seáis  capaces  de 
saber  cómo  (y  solo  en  cierto  modo  “por  qué” ) se  calculan  los  extremos 
relativos  condicionados  o no  de  funciones  de  varias  variables.  Cualquier 
otra  aspiración  me  parece  fuera  de  lugar.  Incluso  esta,  con  el  tiempo 
que  hay,  me  parece  poco  creíble. . . 

El  hecho  de  utilizar  n coordenadas  desde  el  principio  no  tiene  nin- 
guna complejidad.  Es  mejor  acostumbrarse  a pasar  el  trago  en  seguida 
y dejarse  de  historias  raras  como  que  “con  tres  dimensiones  tenemos 
suficiente”.  El  ejemplo  más  cercano  son  los  juegos  de  ordenador,  quizás 
el  más  notable  es  “Civilization” : en  este  juego,  no  hay  un  solo  valor 
que  determine  “quién  lo  ha  hecho  mejor”,  hay  una  colección  de  ellos: 
crecimiento  militar,  éxito  militar,  población,  actitud  de  la  población, 
avance  tecnológico,  crecimiento  económico  (ya  vamos  6 variables,  se  ve 
que  tres  no  eran  suficientes  para  “medir”  el  “éxito”  de  una  civilización) . 

Cuando  uno  calcula  los  modos  de  vibración  de  un  sistema  físico  (por 
ejemplo  un  puente  o un  circuito  eléctrico),  tiene  que  tener  en  cuenta  el 
número  de  nodos  del  modelo.  Cada  nodo  define  un  grado  de  libertad 
(más  o menos,  obviamente),  es  decir,  cada  nodo  se  formaliza  como  una 
variable:  una  dimensión.  Hay  modelos  de  elementos  finitos  con  miles  (y 
millones)  de  nodos. . . Todo  eso  son  variables.  Vectores  (o  puntos,  si  se 
quiere)  con  millones  de  coordneadas.  ¿y  qué? 

Etcétera. 


1.  “Topología”  en  Mn 

El  espacio  de  n— uplas  de  números  reales  (el  producto  cartesiano  de 
n copias  de  M)  se  denomina  M.n.  Sus  elementos  se  escriben  como  una 
lista  de  números  reales  separados  por  comas  y cerrada  entre  paréntesis: 

(x1,x2, xn) 

si  n es  dos,  se  habla  de  pares,  si  n es  tres,  se  habla  de  ternas  o tríos, 
etc. . . 

1.1.  Distancia.  Dados  dos  elementos  (puntos)  de  M" , la  manera 
más  natural  de  medir  la  relación  que  hay  entre  ellos  es  la  distancia. 
En  una  variable  la  distancia  — por  casualidad — coincide  con  el  valor 
absoluto  de  la  diferencia.  En  varias  variables  se  utiliza  la  generalización 
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del  Teorema  de  Pitágoras.  Dados  dos  puntos  x = (xi, . . . ,xn)  e y — 
(7/1, , yn)  de  M”,  se  define  la  distancia  entre  x e y como: 

d(x,y)  = ||(a?i  - 2/1,  • • -,xn  - yn)\\  = - yi)2  H f (Xn  -yn)2 

(las  barras  verticales  paralelas  se  llaman  norma  de  un  vector,  se  ha- 
brá estudiado  algo  relativo  a esto  en  Álgebra,  quizás.)  Es  decir,  la  dis- 
tancia entre  dos  puntos  es  la  longitud  (eso  es  la  norma)  del  vector  que 
los  une. 

La  noción  equivalente  a la  de  intervalo  en  una  variable  es  la  de  bola : 

Definición  52.  La  bola  abierta  de  radio  r alrededor  del  punto  a = 
(a  1, . . . , an)  es  el  conjunto  de  puntos  (xi, . . . ,xn)  que  están  a distancia 
menor  que  r de  (ai, ... , an): 

Br(a)  = {x  = (aq, . . . , xn)  | d(x,  a)  < r}  . 

La  bola  cerrada  es  lo  mismo  cambiando  < por  <: 

Br(a ) = |x  = (xi, . . . , xn)  | d(x,  a)  < r}  . 

Igual  que  el  intervalo,  la  bola  es  el  conjunto  de  puntos  alrededor 
de  a que  están  más  cerca  que  r.  En  dimensión  2 (es  decir,  cuando 
n — 2),  la  bola  abierta  es  el  disco.  En  dimensión  3,  es  una  esfera  sólida, 
etc.  La  bola  abierta  no  incluye  el  “borde”  (digamos,  la  esfera  externa), 
mientras  que  la  bola  cerrada  sí  (en  analogía  con  el  intervalo  abierto  y 
el  cerrado).  Se  llama  bola  punteada  a la  bola  abierta  sin  el  centro  (en 
la  definición,  sin  el  punto  a),  la  denotaremos  Br(a). 

Un  punto  está  “pegado”  a un  conjunto  si  cualquier  bola  alrededor 
de  ese  punto  corta  al  conjunto: 

Definición  53.  Un  punto  a G Mn  es  adherente  a un  conjunto 
X C Mn  si  cualquier  bola  centrada  en  a tiene  intersección  con  X. 

Está  claro  que  los  puntos  de  X son  adherentes  a A"  y esto,  si  bien  es 
intersante,  no  refleja  la  naturaleza  de  los  puntos  “muy  cercanos”  pero 
no  necesariamente  dentro  de  X: 

Definición  54.  Un  punto  a G Mn  es  de  acumulación  de  un  con- 
junto X G Mn  si  cualquier  bola  punteada  centrada  en  a corta  a X. 

Por  ejemplo,  si  A"  = { ^ | n G N } (los  puntos  de  la  sucesión  1/n), 
entonces  los  puntos  1,  |,...  son  todos  obviamente  adherentes  a X, 
mientras  que  el  0 es  además  un  punto  de  acumulación  (que  en  este 
caso  no  pertenece  a A",  pero  podría  hacerlo). 

El  concepto  de  conjunto  abierto  y cerrado  puede  ser  útil,  aunque 
aquí  nos  servirá  más  que  nada  para  ser  precisos 

Definición  55.  Un  conjunto  X G Mn  se  dice  abierto  si  dado  cual- 
quier a G X existe  una  bola  centrada  en  a y totalmente  contenida  en 
X.  Así,  un  abierto  es  un  conjunto  “relleno  por  todas  partes”. 
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Un  conjunto  X G Mn  se  dice  cerrado  si  cualquier  punto  de  acumu- 
lación de  X pertenece  a A".  Es  decir,  un  cerrado  es  un  conjunto  que 
“contiene  su  borde” . 


Diremos  que  X es  un  entorno  de  un  punto  a G Mn  si  hay  una  bola 
centrada  en  a contenida  en  X.  (Por  tanto,  todas  las  bolas  de  radio  más 
pequeño  también  lo  están).  Un  entorno  de  un  punto  es  un  conjunto 
que,  alrededor  de  ese  punto  está  “relleno” . 

Definición  56.  Diremos  que  una  función  / : X — » M es  un  infi- 
nitésimo en  a = (ai, ... , an ) G Mn  — o que  tiene  límite  0 en  a — si 

■ A"  es  un  entorno  de  a y 

■ Para  cualquier  £ > 0,  existe  una  distancia  ó > 0 tal  que  si 
d(x,a ) < 5 entonces  \f(x)\  < e. 

Nótese  que  para  definir  infinitésimo  se  impone  que  /(a)  = 0 (pues  si 
no,  no  se  cumple  la  segunda  condición).  Hablaremos  de  infinitésimo  sin 
más  cuando  a sea  (0, . . . , 0). 


Exactamente  como  en  el  caso  de  una  variable,  la  definición  de  in- 
finitésimo “signfica”  que  “la  función  se  hace  muy  pequeña  cerca  de  a” 
(es  decir,  se  hace  “arbitrariamente  pequeña”  se  acerque  uno  como  se 
acerque  a 0).  Como  se  ve,  se  utiliza  la  única  medida  de  “distancia” 
posible  que  hay  en  Mn,  que  es  la  dada  arriba  por  la  norma.  No  se  puede 
comprobar  si  algo  converge  a cero  mirando  en  una  u otra  dirección. 


Ejemplo 


Considérese  la  función  en  M2 
0 si  xy  = 0 


f(x,y)  = 


— si  xy  0 

xy  & / 


Es  obvio  que  lím^0  f(x,  0)  = 0 y que  límy_0  /(0,  y)  = 0.  Pero  también 
debería  ser  obvio  que  f no  es  un  infinitésimo  en  a = (0,  0). 


Definición  57.  Sea  / : X — > M una  función  definida  en  un  subcon- 
junto de  Mn.  Se  dice  que  / es  continua  en  a G X si  existe  un  infinitésimo 
en  a,  digamos  d(x)  y una  distancia  r tal  que 

f(x)  = /(a)  + d(x) 

para  todo  x G X fl  Br(a ) (Usamos  esta  intersección  porque  X no  tiene 
por  qué  ser  un  entorno  de  a,  aunque  lo  será  siempre  en  las  aplicaciones). 


Así  pues,  una  función  continua  en  un  punto  a es  una  función  que, 
cerca  de  a vale  “lo  que  vale  en  a más  un  infinitésimo”.  De  este  modo, 
una  función  es  continua  si  se  aproxima  a f(a ) “cerca”  de  a. 

Una  noción  menos  relevante  es  la  de  límite  de  una  función  en  un 
punto. 

Definición  58.  Se  dice  que  l es  el  límite  de  / en  a (con  /ya  como 
arriba)  si  existe  un  infinitésimo  en  a,  digamos  d(a;)  tal  que 

f(x)  = l + d(x) 
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para  x en  una  cierta  bola  punteada  x G Br(a). 

Desde  luego,  una  función  es  continua  en  a si  tiene  límite  en  a y este 
coincide  con  /(a).  Vamos  a estudiar  muy  pocas  funciones  con  límite 
pero  no  continuas. 

EJEMPLO  9.  ¿Qué  pasa  con  la  función  f(x,y ) = sen(  V)  (poniendo 
f(x,y ) = 0 si  xy  = 0)  en  a = (0,0)?  Lo  mismo  que  con  la  función  de 
la  figura  7 (que  no  es  continua  en  (0,0)).  Ni  siquiera  se  puede  definir 
un  “límite”  en  ese  punto. 

Definición  59.  Se  dice  que  / : X — > M es  continua  en  X si  es 
continua  en  todos  sus  puntos. 

Antes  de  enunciar  los  teoremas  equivalentes  a los  de  una  variable, 
necesitamos  la  noción  de  conjunto  compacto  (una  de  las  más  fructífe- 
ras): 

Definición  60.  Un  conjunto  X c se  dice  compacto  si  es  cerrado 
y acotado.  Es  decir,  si  es  cerrado  y existe  R > 0 tal  que  X C BR( 0)  (si 
cabe  dentro  de  una  bola  lo  suficientemente  grande). 

1.2.  Los  teoremas  de  la  continuidad.  El  primer  resultado  im- 
portante es: 

Teorema  24.  La  imagen  de  un  compacto  por  una  aplicación  con- 
tinua es  un  compacto. 

De  donde  se  deduce  que: 

Corolario  2 (Weierstrass  en  n variables).  Si  f : X — > M es  una 
aplicación  continua  de  un  subconjunto  de  Mn  en  M y X es  compacto, 
entonces  existen  a,b  G X tales  que  f(a ) es  el  máximo  de  f(X)  y f(b) 
es  el  mínimo  de  f(X).  [Recuérdese  que  f(X)  es  el  conjunto  de  valores 
que  toma  f , el  recorrido/ 

Por  otro  lado,  es  evidente  del  Teorema  de  Bolzano  que: 

Teorema  25.  Si  f : X — > IR.  es  continua  y existen  a,b  G X tales 
que  f{a)  < f(b)  y el  segmento  que  une  a y b está  incluido  en  X, 
entonces  existe  c G X tal  que  f(c)  = 0. 

De  hecho,  el  resultado  que  se  puede  obtener  es  mucho  más  fuerte, 
pero  lo  dejamos  para  más  adelante  (cuando  definamos  curva). 

1.3.  Funciones  con  valores  en  M"' . Igual  que  podemos  definir 
funciones  / : Mn  — > IR,  se  puede  pensar  en  funciones  que  comienzan  en 
Mn  y terminan  en  Mm:  lo  que  clásicamente  se  conoce  como  funciones 
vectoriales.  Las  denotaremos  utilizando  el  vector  de  sus  componentes: 
/ : M”  — > Mm  no  es  más  que  una  colección  de  m funciones  /¿  : Mn  — > M. 
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Ejemplo  10.  En  la  superficie  delimitada  por  el  mapa  de  España 
(es  decir,  en  un  conjunto  de  M2),  se  puede  poner  en  cada  punto  el  vector 
dado  por  la  velocidad  del  viento  en  un  instante.  En  cada  punto  (x,  y) 
del  mapa  se  tendrá  un  vector  (en  este  caso  también  de  2 componentes) 
(i>i (x,y),v2(x,y)).  Esto  es  una  aplicación  de  M2  en  M2. 

Ejemplo  11.  Con  la  misma  idea  de  antes,  en  lugar  de  solo  el  vector 
velocidad,  se  puede  asignar  a cada  punto  del  plano  la  velocidad  del 
viento,  la  temperatura  y la  presión  atmosférica.  Esto  da  una  aplicación 

/ : M2  -»•  M4 

cuyas  componentes  son,  por  ejemplo,  (vi(x,y),V2(x,y),t(x,y),p(x,y)). 

Ejemplo  12.  Dado  un  intervalo  [r,  s]  c M,  se  define  una  curva 
parametrizada  por  [ r , s]  como  una  aplicación  7 : [r,  s]  — > (para  un 

n determinado)  que  cumple  cierta  condición  (que  enunciaremos  en  un 
momento).  La  aplicación  7 define  una  asignación  í i->  (7^), . . . , 7 n(t)), 
que  a cada  número  t (piénsese  en  t como  “la  variable  temporal  tiempo” ) 
hace  corresponder  un  punto  del  espacio  Mn,  es  decir,  a cada  número  le 
corresponde  una  n— upla  de  números  (los  7 ¿(í)  para  i — 1, . . . ,n).  Se 
dice  que  7 es  una  curva  si  cada  una  de  las  componentes  7 ¿(í)  es  una 
función  continua. 

Es  obvio  que  las  funciones  vectoriales  no  son  más  que  colecciones 
de  funciones  que  toman  valores  en  M.  Así,  es  lógico  que  se  defina 

Definición  61.  Una  función  vectorial  / : Mn  — > Mm  es  continua  si 
cada  una  de  sus  componentes  es  continua. 

En  el  ejemplo  11,  es  lógico  pensar  que  tanto  las  componentes  de  la 
velocidad  del  viento  como  la  temperatura  en  cada  punto  y la  presión  son 
funciones  continuas  (pero  ¿por  qué  es  lógico  esto?).  Es  lógico  pedirle  a 
una  curva  que  sea  continua  (porque  uno  espera  que  una  curva  se  pueda 
trazar , si  no  sería  un  “salto”,  no  una  curva). 

Definición  62.  LIn  conjunto  X c Mn  se  dice  conexo  si  dados  dos 
puntos  a,  b G A",  existe  siempre  una  curva  que  comienza  en  a y termina 
en  b. 

LIn  conjunto  es,  por  tanto,  conexo  si  dos  puntos  que  le  pertenecen 
se  pueden  conectar  siempre  (de  ahí  el  nombre). 

Lema  27.  Sean  f : Mn  — ■>  Mm  y g : dos  funciones  conti- 

nuas. La  función  compuesta  g o / : Mn  — > Rl  es  continua. 

Demostración.  Obvio  (no  hay  más  que  usar  la  condición  de  in- 
finitésimo para  cada  coordenada,  etc. . . ).  □ 

El  Teorema  de  Bolzano  bien  extendido  a Mn  es: 
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Teorema  26.  Sea  X c Mn  un  subconjunto  conexo  y f : X ^ R 
una  función  continua  en  X.  Si  existen  a,b  e X tales  que  f(a)  > 0 y 
f(b ) < 0,  entonces  existe  al  menos  un  c G X tal  que  f(c)  =0. 

Demostración.  Debería  ser  sencillita. . . No  hay  más  que  “trasla- 
dar el  problema  a M”  mediante  la  curva  que  une  a y b y utilizar  ahí  el 
teorema  de  Bolzano.  □ 

Como  se  ve,  toda  la  idea  de  continuidad  se  refiere  a funciones  para 
las  que  tiene  sentido  la  noción  de  aproximación  (una  función  es  conti- 
nua en  un  punto  si  su  valor  se  aproxima  al  valor  en  el  punto  cuando  la 
variable  se  aproxima  al  punto).  De  hecho,  todo  el  Análisis  es  una  teoría 
de  la  aproximación  (y  cada  condición  que  se  estudia  es  una  “mejora”  de 
las  propiedades  aproximativas) . La  continuidad  es  la  noción  más  simple 
de  aproximación.  La  siguiente  que  estudiaremos  es  la  diferenciabilidad 
que  se  corresponde  con  la  derivabilidad  en  una  variable. 

2.  Diferencial  de  una  función 

En  una  variable,  una  aplicación  / : 1 -»  le s derivable  en  xq  si 
existen  un  número  A y un  infinitésimo  d(/i) 

(7)  f(x0  + h)  = f(x0)  + \h  + d(h)h 

para  h “pequeño”.  Lo  escrito  arriba  es  obviamente  equivalente  a que 
exista  el  límite 

lím  f{x o + h)  - f(x o) 

h->0  fl 

y que  sea  igual  a A,  que  es  la  “definición  de  derivada  como  pendiente”. 

Pensando  en  aproximaciones,  lo  que  tenemos  es  que  / es  derivable 
en  xq  si  / es,  cerca  de  x0  el  valor  f(x0)  más  una  función  h i— > A h más 
un  infinitésimo  multiplicado  por  h,  que  mide  “cuánto  de  mal  aproxima 
la  recta  tangente  a la  función  en  xf\  Esta  es  la  noción  que  vamos  a 
traspasar  a Mn,  la  noción  de  aproximación. 

Definición  63.  Sea  / : X — > M una  función  definida  en  X c Mn 
y sea  a = (ai, . . . ,an)  G X un  elemento  de  X.  Se  supone  que  X es 
un  entorno  de  a.  Se  dice  que  / es  diferenciable  en  a si  existen  una 
aplicación  lineal  A : Mn  ->Ry  un  infinitésimo  d(h)  tales  que 

f(a  + h)  — f(a)  + A(h ) + ||h||d(/i), 
donde  \\h\\  es,  como  siempre,  la  norma  del  vector  h. 

Es  decir,  una  función  de  n variables  es  diferenciable  si  se  parece 
mucho  a una  aplicación  lineal.  “Mucho”  significa  que  la  diferencia  en- 
tre la  función  y la  aplicación  lineal  es  infinitamente  más  pequeña  que 
“la  longitud”  del  vector  h.  Como  se  vio  al  hablar  de  infinitésimos  en 
una  variable  (Definición  20),  la  comparación  entre  infinitésimos  se  hace 
dividiendo,  y como  no  sabemos  dividir  por  vectores,  se  utiliza  la  norma 
(el  “módulo”)  para  medir  el  tamaño  de  un  vector  y a la  hora  de  dividir. 
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Es  decir,  una  función  diferenciable  en  a se  podrá  escribir 

f(a  + h)  = f (a)  + (Ai/ii  + • • • + A nhn)  + d(/i)  ||  h\\ , 

de  manera  que  /(a  + h ) — f(a ) será  “casi  igual”  a una  combinación 
lineal  de  las  componentes  de  h , pues  estas  son  las  únicas  aplicaciones 
lineales  que  conocemos  (¿o  no?). 

Nota  8.  Recuérdese  eso:  si  A : Mn  — > M es  una  aplicación  lineal, 
tomando  la  base  estándar,  e\  = (1,  0, . . . , 0), . . . , en  = (0, . . . , 0, 1),  se 
tendrán  valores  Ai  = A(e i),...,Xn  = A(en)  de  manera  que  si  h = 
(hi, . . . , hn ) es  un  vector  cualquiera  de  Mn,  entonces 

íhl  \ 

A(h)  — ( Ai  ...  An  ) I • I — Xihi  + • • • + A nhn. 

V / 

De  ahí  la  expresión  del  párrafo  anterior. 

Para  aplicaciones  de  Mn  en  Mm  la  definición  es  “exactamente  la 
misma” : 

Definición  64.  Una  función  / : X — > Mm  de  un  subconjunto 
X C Mn  es  diferenciable  en  x0  (se  supone,  como  antes,  que  X es  un 
entorno  de  xq)  si  cada  una  de  sus  componentes  es  diferenciable. 

De  hecho,  (no  lo  vamos  a demostrar),  se  tiene  el  siguiente  resultado: 

Teorema  27.  Una  función  vectorial  f : X — > es  diferenciable 
en  Xq  si  y solo  si  existen  una  aplicación  lineal  A : Mn  — > Mm  y un 
infinitésimo  d tales  que 

f(x  o + h)  = f(x  o)  + A(h)  + ||ú||d(/i), 

“cerca”  de  x0.  Es  decir,  si  f es  “prácticamente”  una  aplicación  lineal 
cerca  de  Xq. 

De  la  misma  manera  que  antes,  la  aplicación  lineal  A tendrá  una 
cierta  matriz  en  las  bases  estándar,  pero  nos  estamos  adelantando 

Notación:  de  ahora  en  adelante,  si  / : X C Mn  — > es  diferen- 

ciadle en  un  punto  a £ X (según  la  definición  de  arriba),  la  aplicación 
lineal  de  la  definición  se  llamará  la  diferencial  de  f en  a y se  deno- 
tará Da(f ) o,  más  sencillamente,  Daf. 

2.1.  Funciones  derivables  obvias.  Antes  de  seguir,  enuncia- 
mos los  resultados  obvios  de  diferenciabilidad  de  funciones,  para  poder 
poner  ejemplos. 

Teorema  28.  Sean  f,g  : X c 1"  ->  R dos  aplicaciones  y a e X 
un  punto  de  X del  cual  este  es  un  entorno.  Entonces: 

■ Si  f es  constante  en  un  entorno  de  a,  f es  diferenciable  en  a y 
su  diferencial  es  la  aplicación  lineal  nula:  0. 
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■ Si  f y g son  diferenciables  en  a,  entonces  f ± g y fg  son  dife- 
renciables  en  a.  Si  además  g(a ) ^ 0,  entonces  f/g  también  es 
diferenciable  en  a.  Además: 


Da(f  + g)  = Da(f)  + Da(g) 
Da(fg)  = g(a)Da(f ) + f(a)Da(g ) 
g(a)Da(f)  - f{a)Da{g) 


Da(f/g ) = 


g(a) 


■ Las  aplicaciones 
dables  en  a y 


“coordenadas”  f(x i, . . . , xn) 


Xi  son  diferen- 


(o  sea,  la  diferencial  es  la  proyección  en  la  i— ¿sima  coordena- 
da). 


Con  esto  tenemos,  por  ejemplo,  qne  cualquier  expresión  racional  en 
las  coordenadas  es  diferenciable  en  los  puntos  en  que  el  denominador 
no  se  anula. 


3.  Derivadas  parciales  - matriz  jacobiana 


Fijemos  una  aplicación  / : X C Mn  — » M y un  punto  a G X tal  que 
X es  un  entorno  de  a (de  ahora  en  adelante  utilizaremos  la  nomencla- 
tura clásica  y diremos  que  a es  un  punto  interior  de  X.)  Supongamos 
que  / es  diferenciable  en  a.  Como  se  ha  visto,  esto  quiere  decir  que 
existe  una  aplicación  lineal  Daf  que  aproxima  muy  bien  a /,  es  decir, 
tal  que  existe  un  infinitésimo  d(/i)  tal  que 

f(a  + h)  = f(a)  + (Daf)(h)  + \\h\\d(h). 


Pero  en  la  vida  real  utilizamos  coordenadas  para  todo.  En  las  bases 
estándar,  el  vector  h (el  “incremento  de  la  variable” ) tendrá  coordena- 
das h = (hi, . . . , hn ) y su  norma  será  \Jli\  + • • • + h2n.  En  estas  coorde- 
nadas, la  aplicación  lineal  tendrá  una  expresión 

Da(f)~{. ...  An) 

de  manera  que,  como  dijimos  arriba,  quedará 


/(a  + h)  — f(a ) + (Ax 


+ ...  + h*d{h). 


Ahora  bien.  Supongamos  que,  en  lugar  de  utilizar  un  vector  genérico, 
tomamos  uno  que  es  proporcional  a un  elemento  de  la  base  estándar: 
p.ej.  el  primero,  h = (h\,  0, . . . , 0).  Queda 

/(ai  + hi,  a2,  ■ ■ • , an)  = /(ai, . . . , an)  + Ai/ii  + hirj(hi) 
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donde  r¡  es  un  infinitésimo  (importa  poco  cómo  es,  pero  es  infinitési- 
mo). Es  decir,  si  se  dejan  constantes  todas  las  coordenadas  del  punto 
(ai, ... , an)  menos  la  primera , el  hecho  de  que  / sea  diferenciable  quiere 
decir  que  la  aplicación 

/i  : M ->  R 

dada  por  f\  (x)  = f(x,  a2, . . - , an)  es  una  función  de  una  variable  deri- 
vable  en  ai. 

El  mismo  razonamiento  sirve  para  el  resto  de  coordenadas: 


Teorema  29.  Si  f : X c Rn  — > M es  diferenciable  en  un  punto 
a G X interior  a X , entonces  cada  una  de  las  funciones 

fi-.R^R 


de  una  variable  que  consisten  en  “dejar  fijas  todas  las  coordenadas  me- 
nos la  i”  son  derivables  en  a,. 

Las  derivadas  fífaf)  se  llaman  derivadas  parciales  de  / (con  res- 
pecto a la  coordenada  i,  respectivamente)  y se  denotan: 


df_ 

dxi 


a 


o bien 


df_ 

dxi 


(a). 


Cuando  se  entiendan  las  derivadas  parciales  como  funciones  en  X 
(pues  es  lo  que  son,  al  fin  y al  cabo,  para  cada  elemento  interior  a X 
en  el  que  existen,  toman  un  valor),  se  denotarán  sin  hacer  referencia 
al  punto: 

d¿ 

dxf 


Del  teorema  recién  enunciado  y de  toda  la  discusión  anterior  se 
deduce,  que: 


Teorema  30.  La  matriz  de  Da(f ) en  la  base  estándar  es  la  matriz 
de  las  derivadas  parciales  de  f en  a: 


df_ 

dxn 


A.(/)^(g T 

Esta  matriz  se  denomina  matriz  jacobiana  de  f 


Por  la  misma  razón,  dada  la  definición  de  función  vectorial  diferen- 
ciable (Definición  64),  se  tiene  que 


Teorema  31.  La  matriz  de  la  diferencial  de  una  función  vectorial 
f : X C Mn  — > en  un  punto  a en  las  bases  estándar  es  la  matriz 

formada  por  las  derivadas  parciales  de  cada  coordenada  de  f : 


Da(f) 


( dfi 

fifi 

\ 

dxi 

a 

8xn 

a 

Ófrn 

d.fm 

y dxi 

a 

dxn 

a) 
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Esta  matriz  se  denomina  matriz  jacobiana  de  / en  a.  Se  denotará,  a 
veces,  Ja(f). 


Ejemplo  13.  Comencemos  con  un  ejemplo  simple:  una  aplicación 
afín  tiene  que  tener  una  diferencial  “esencialmente  igual”  a ella.  Sea 
f(x,  y,z)  = 3 — 2x  + Ay  — 7 z.  ¿Es  diferenciable?  Sabemos,  por  el  Teo- 
rema 28  que  sí,  que  lo  es  en  todo  punto.  Sea  p = (x,  y,  z ) un  punto 
cualquiera.  ¿Cuál  es  la  matriz  jacobiana  de  / en  pl  Hemos  de  calcular 
las  parciales.  Para  ello,  se  dejan  constantes  todas  las  variables  menos 
la  que  se  deriva : 

<9(3  — 2x  + 4y  — 7 z) 


<9(3  — 2 x + Ay  — 7 z) 
dz 

es  decir,  que  por  la  definición  de  diferenciabilidad,  queda  que 


<9(3  — 2x  + Ay  — 7 z) 
dy 

= -7, 


f(p+  h) 


/(p)  + (- 2 4 


+ IN|d(fi) 


para  un  infinitésimo  d(/i).  Si  p — (0,  0,  0),  por  ejemplo,  lo  que  queda  es 
(sabemos  que  /(O,  0,  0)  = 0: 

/(/?i,  /i-2,  hs)  = 3 — 2 hi  + 4 1%2  — 7hz  + ||h||d(/r) 


pero,  también  sabemos  que  f(x,y,z ) = 3 — 2x  + Ay  — 7z,  así  que  en 
este  caso  concreto  la  diferencial  vale  lo  mismo  que  la  parte  lineal  de  la 
función  y la  aproximación  es  obviamente  exacta,  d(h)  = 0. 


Ejemplo  14.  Un  ejemplo  algo  más  elaborado.  Consideremos  la 
aplicación  diferencible  f(x,y)  = 1 — x2  — y2  (cuya  gráfica  es  un  para- 
boloide de  revolución  “hacia  abajo”).  Está  claro  que  la  función  f(x,y ) 
tiene  un  máximo  en  (0,  0)  — ¿está  esto  claro?  Calculemos  su  diferen- 
cial. Como  siempre  se  hace,  utilizamos  las  parciales.  En  un  punto  (x,  y) 
estas  son: 

df(\  o \ 9 

— ( x,y)  = -2x , —{x,y)  = -2y, 

de  modo  que  ^(0,0)  = 0 y |4(0,0)  = 0.  Las  derivadas  parciales  son 
ambas  0 en  el  origen  y por  tanto  la  aplicación  diferencial  es  la  nula 

79(o,o)/  - (0  0). 

Debería  ser  obvio  que  las  parciales  tienen  que  ser  0 en  el  origen.  Si  se 
considera  la  función  f\{x)  = f(x,  0)  = 1—  x2,  esta  es  una  función  de  una 
variable  que  tiene  un  máximo  en  x — 0,  así  que  su  derivada  en  0 tiene 
que  ser  nula.  Lo  mismo  ocurre  si  se  considera  f‘¿ (y)  = /(0,  y)  — 1 — y2. 
Por  eso  las  parciales  son  nulas,  porque  el  origen  es  un  máximo  de  / al 
igualar  una  de  las  coordenadas  a 0. 


4.  REGLA  DE  LA  CADENA 
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En  otros  puntos,  está  claro  que  alguna  de  las  derivadas  parciales  no 
es  nula,  pues  ^ = —2x  y ^ = —2 y. 

Ejemplo  15.  Una  función  vectorial:  sea  / : M3  — > M4  la  función  que 
a cada  punto  del  espacio  le  asigna  el  vector  ( x 3, 2 — xy,  z + x — y,  zxy ). 
Sabemos  que  es  diferenciable  por  el  Teorema  28.  ¿Cuál  es  su  matriz 
jacobiana  en  un  punto  (. x,y,z)7  Fácil: 


( 3x2 

0 

°\ 

-y 

— X 

0 

i 

-1 

1 

\zy 

zx 

xy) 

. . . ¿por  qué?  ¿por  qué  tiene  tres  columnas  y cuatro  filas? 

4.  Regla  de  la  cadena 

Uno  de  los  resultados  básicos  es  la  regla  de  la  cadena: 

Teorema  32  (Regla  de  la  Cadena).  Sean  f : X c Mn  — > Mm  y 
g : Y C dos  aplicaciones  vectoriales.  Supongamos  que  a G X 

es  un  punto  interior  de  X y que  b = / (a)  G Y es  un  punto  interior  de 
Y . Si  f es  diferenciable  en  a y g es  diferenciable  enb  = /(a),  entonces 
g o / es  diferenciable  en  a y su  diferencial  es  la  composición  de  Daf 
con  Df^g,  es  decir: 

Da(g  o /)  = Df{a)g  O Daf. 

Demostración.  Esto  es  prácticamente  evidente  utilizando  la  de- 
finición de  diferencial  como  aplicación  lineal  que  aproxima.  Se  sabe 
que 

f(a  + h)  = f(a)  + DJ(h)  + \\h\\d(h) 

y que 

(8)  9(f(a)  + h)=  g(f(a))  + Df{a)g(h)  + ||fi||d2(/j) 

para  ciertos  infinitésimos  (vectoriales  pero  es  irrelevante)  cR  y d2.  Por 
consiguiente: 

g(f(a  + h))  = g(f(a)  + Daf(h ) + ||/i||di(/i)) 
que  es  igual,  por  ser  g diferenciable,  a 

g(f(a  + h))  = g(f(a))  + ( Dña)g)(Daf(h ) + [|/i||di(/i))+ 

+ ||  DJ(h)  + \\h\\5(h)\\d2(Daf(h)  + PIM/i)). 

Es  relativamente  sencillo  comprobar  que  || Daf(h)  + ||/i||di(/i) ||  es  un 
infinitésimo  del  tipo  ||fi||d3(/r)  y que  d2(Da/(/i)  + ||fi||di(fi))  es  un  infi- 
nitésimo en  h , por  lo  que: 

g(f(a  + h))  = g(f(a))  + ( Dmg)(Daf(h ) + Md^h))  + \\h\\d4(h) 
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para  cierto  inifnitésimo  cL i(h).  Por  otro  lado,  (Df^g)  es  un  aplicación 
lineal,  así  que 

(Dmg)(Daf(h)  + \\h\\di(h))  = (D/(a)^)(JDa/(/i))  + ||/i||(JD/(a)^)(d1(/i)) 

y la  función  (D f^g) (di (h))  es  (se  comprueba  fácilmente  por  ser  lineal 
Dña)g)  un  infinitésimo  en  h.  De  donde  la  expresión  inicial  (8)  queda 

g(f(a  + h))  = g(f(a ))  + (. Df{a)g)(DJ(h ))  + ||/i||d5(/i) 

para  cierto  infinitésimo  d$(h).  La  composición  de  aplicaciones  lineales 
Df(a)9  y Daf  es  lineal  y,  por  tanto,  g o f es  diferenciable  en  o. 

En  esta  demostración  se  han  introducido  “muchos”  infinitésimos 
con  nombres  d¿.  En  realidad,  el  “Físico”  qne  llevamos  dentro  los  lla- 
maría a todos  d(h)  y “a  correr”:  lo  único  relevante  es  qne  son  infinitési- 
mos, no  sus  nombres.  □ 

Puede  parecer  todo  “muy  técnico” , pero  de  este  resultado  se  deduce: 

Teorema  33.  Si  f : Mn  — > M es  diferenciable  en  a,  entonces 

■ La  exponencial  exp(/(x))  es  diferenciable  en  a, 

■ Las  funciones  trigonométricas  de  f son  diferenciables  en  a ( don- 
de estén  definidas), 

■ Si  f(x)  > 0 entonces  log (f(x))  es  diferenciable  en  x, 

■ Si  f (x)  > 0 y c E R > 0 entonces  f(x)c  es  diferenciable  en  x, 

■ La  función  f(x)9('x')  es  diferenciable  siempre  que  esté  definida l, 

■ Etc. . . 

Es  decir,  “todo”  lo  que  se  puede  escribir  con  las  operaciones  nor- 
males con  la  funciones  coordenadas  y allá  donde  tenga  sentido,  “va  a 
ser”  diferenciable. 

Corolario  3.  La  regla  de  la  cadena  es  muy  sencilla  de  utilizar  con 
las  matrices  jacobianas.  Sean  f y g como  en  el  Teorema  32.  Entonces 
la  matriz  jacobiana  de  g o f en  un  punto  a es  el  producto  de  la  matriz 
jacobiana  de  g en  f(a ) por  la  matriz  jacobiana  de  f en  a.  Es  decir, 

Ja(g°  f)  = Jf{a)g-Ja(f), 

exactamente  igual  que  en  una  variable  (pues  una  variable  es  un  caso 
particular  de  varias). 

Ejemplo  16.  La  función  / : M3  — > M dada  por 
f(x,  y , z)  = sen(— x + 2y  — 3^) 

es  la  composición  de  h(x,y,z ) = — x + 2y  — 3z  con  g(t)  = sen(í). 
Sabemos  que  la  matriz  jacobiana  de  h es  (—1  2—3)  mientras  que 

1Estamos  abusando  de  la  notación  muchísimo. 
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la  matriz  jacobiana  de  g en  un  punto  t es  (cos(í)).  Así  que  la  matriz 
jacobiana  de  / en  (. x,y,z ) es: 


J(x,y,z)f  J—x+2y—3z(g)  ' J(x,y,z)(h)  (cOs(  X + 2y  3-2-))  ( 1 ? 3) 

= (—  cos(— x + 2y  — 3z)  2cos(—x  + 2y  — 3z)  — 3cos(— x + 2y  — 3z))  , 

que,  claramente,  tiene  1 fila  y 3 columnas,  pues  la  función  / va  de  M3 
a M. 


Si  tratamos  de  calcular  esa  matriz  jacobiana  utilizando  las  parciales, 
es  igual  de  sencillo.  Con  respeto  a x,  se  tiene  (hay  que  dejar  y y z 
constantes): 


<9(sen(— x + 2y  — 3^)) 


dx 


{x,y,z) 


cos( — x + 2 y — 3 z). 


Con  respecto  a y: 

d(sen(— x + 2 y — 3z)) 
d y 


(x,y,z) 


2 cos( — x + 2 y — 3 z). 


Y,  finalmente, 

<9(sen(— x + 2y  — 3^)) 
d y 


( x,y,z ) 


—3  cos( — x + 2 y — 3 z). 


Por  tanto, 

J(x,y,z)f 

= (—  cos(— x + 2y  — 3z)  2cos(—x  + 2y  — 3z)  — 3cos(— x + 2y  — 3z))  , 

como  arriba  (. . . claro. . . ). 


5.  ¿Plano  tangente?  ¿¿curvas  de  nivel?? 

Vamos  a hacer  algo  de  geometría  y eso. . . 

Por  un  momento  nos  restringimos  a M2.  Si  / : X C R2  ->  1 es 
una  función  real  en  un  subconjunto  del  plano,  puede  dibujarse  (no  es 
necesariamente  sencillo).  Es  relativamente  sencillo  en  WolframAlpha. 
Sea  f(x,  y)  = x2  + y2  — sen (xy),  si  se  introduce 

plot  (x''2+y''2-sin(x  y)  ,x=[-2,2]  ,y=[-2,2] ) 

se  obtiene  un  hermoso  dibujo  tridimensional  donde  la  superficie  pintada 
representa  el  valor  (en  la  coordenada  z)  de  la  función  / en  el  punto 
(. x,y ).  El  cuadrado  base  es  [—2,2]  x [—2,2],  eso  es  lo  que  significan  el 
segundo  y tercer  parámetros  del  comando. 

Además,  aparece  otro  dibujo  “titulado”  Contour  plot.  Representa, 
como  veremos  más  adelante,  las  curvas  de  nivel:  cada  curva  indica  una 
zona  en  la  que  la  función  toma  el  mismo  valor.  En  el  ejemplo,  son 
una  especie  de  óvalos  inclinados  cuarenta  y cinco  grados  (por  el  xy  del 
seno). 

Olvidemos  los  gráficos  anteriores  y centrémonos  en  una  función  más 
sencilla.  Ya  hemos  estudiado  el  paraboloide  de  revolución  en  el  Ejemplo 
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Figura  1.  Gráfica  de  x2  + y2  — sen(xy)  por  WolframAlpha. 


Figura  2.  Curvas  de  nivel  de  x2  + y2  — sen(au/)  por  WolframAlpha. 

14.  Volvamos  a él.  Su  ecuación  era  f(x,y)  = 1 — x2  — y2.  Es  decir,  su 
gráfica  viene  dada  por  la  ecuación  z = 1 — x2  — y2. 

Si  calculamos  su  diferencial  en  un  punto  (a,  b),  sale 

J(a,b)(f)  = -2a  -26. 

Es  decir,  que  cerca  del  punto  ( a,b ),  la  función  f(x,y ) se  puede  re- 
presentar como 

f (a  + hi,b  + h2)  = / (a,  b ) + (—2 a —26)  (ji^) 

para  cierto  infinitésimo  d(/i).  Si  ahora  nos  olvidamos  de  que  hemos 
calculado  una  diferencial  y todo  eso  y simplemente  consideramos  la 
aproximación , podemos  pensar  en  ella  como  en  una  función  definida 
“alrededor  de  (a,  6)”;  llamando  h\  = x — a y h2  = y — b (los  incrementos 
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de  la  variable  cerca  del  punto),  queda: 

z = f(a,b)  +—2a(x—a)  +—2b(y  — b)  = (l  — a2  — b2)  — 2a(x—a)  — 2b(x—b), 

que  es  una  función  lineal:  una  ecuación  de  primer  grado  en  (. x,y,z ), 
es  decir. . . un  plano.  Si  os  fijáis,  la  expresión  de  arriba  tiene  la  misma 
estructura  que 

(9)  y = f(a)  + f'{a){x  - a), 

lo  único  que,  en  lugar  de  una  variable  hay  dos  y en  lugar  de  la  derivada, 
se  calculan  las  parciales.  La  expresión  (9)  es,  recuérdese,  la  de  la  recta 
tangente  a una  función  en  a,  lo  que  nos  ha  quedado  en  dimensión  2 
(tres  si  se  cuenta  la  z)  es  el  plano  tangente  a la  gráfica  de  f(x,y)  en  el 
punto  ( a,b ).  De  hecho,  esto  es  general: 


Teorema  34.  Si  f : X 
H2;  entonces  la  expresión 


z = í(a)+% 


es  diferenciable  en  un  punto  a6lc 

df 


x 


dy 


y 


es  la  ecuación  del  plano  tangente  a la  gráfica  de  f sobre  punto  a. 


Siguiendo  con  el  paraboloide,  en  el  punto  (x,  y)  = (0,  0)  calculamos 
en  su  día  la  diferencial,  que  es  la  aplicación  nula  (es  decir,  las  dos 
parciales  son  0 en  (0,0)).  Por  tanto,  el  plano  tangente  al  paraboloide 
z = — x 2 — y2  + 1 sobre  (0,  0)  tiene  por  ecuación 

z = 1 


que  es,  claro,  un  plano  horizontal : el  punto  (0,0,1)  es  el  máximo  del 
paraboloide  y ahí  su  gráfica  es  “plana”. 


Figura  3.  Paraboloide  y plano  tangente  en  (0,  0, 1). 
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6.  Curvas  de  nivel  y vector  gradiente 

Otra  manera  de  representar  una  función  de  2 variables  es,  como 
en  la  Figura  2,  utilizando  las  curvas  de  nivel:  estas  representan  líneas 
en  las  que  una  función  f(x,y ) toma  el  mismo  valor.  Son  exactamente 
las  curvas  de  nivel  de  un  mapa:  en  estos,  cada  curva  indica  una  altura 
constante,  cuando  se  representa  una  función,  se  puede  tomar  cada  valor 
de  la  función  como  una  “altura”  y conectar  los  puntos  que  están  a la 
misma  altura,  de  esta  manera  se  genera  un  “mapa”  en  el  plano,  que 
representa,  de  otra  manera,  la  gráfica  de  f(x,y). 


Figura  4.  Curvas  de  nivel  de  un  mapa  cartográfico. 

Las  curvas  de  nivel,  así,  son  las  zonas  (curvas)  en  las  que  f(x,y ) es 
constante.  Es  decir,  la  curva  de  nivel  de  “altura”  c viene  dada  por  la 
ecuación 

/ (x,  y)  = c. 

Como  se  ve,  esta  función  define  una  curva  7 (i)  (se  ve,  no  lo  hemos 
demostrado,  lo  haremos  más  adelante).  Supongamos  que  esta  curva  es 
diferenciable,  etc. ...  Su  ecuación  será  q(í)  = (71  (í),  72  (t)).  Si  conside- 
ramos la  función 

h(t)  = /(  7i(í),72(í)), 

que  a cada  “instante”  le  asigna  el  valor  de  / en  el  punto  correspondiente 
de  la  curva,  es  obvio  que  h(t)  = c cualquiera  que  sea  t (pues  la  curva 
es  exactamente  el  sitio  en  que  / vale  c).  Es  decir,  h(t)  es  una  función 
constante  y por  tanto  tiene  derivada  0.  ¿Cómo  se  calcula  su  derivada? 
Con  la  regla  de  la  cadena,  pues  h — f 07.  Por  tanto 

h'(t)  = %/oDt(7)(¿) 

pero  7 es  una  función  de  1 a l2,  así  que  su  diferencial  tiene  dos  filas  y 
una  columna,  y / es  justo  lo  dual,  así  que  tiene  una  fila  y dos  columnas. 
La  iacobiana  de  7 es 

7i \t)\ 
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mientras  que  la  de  / es 


de  manera  que 


T«>(/)  = 


( 1 

d¿ 

l dx  l7(í) 

dy 

7(í) 


h'{t) 


( &l\ 

l dx  l7(í) 


0 


donde  la  igualdad  a 0 es  precisamente  el  hecho  de  que  h{t)  es  constante 
en  la  curva. 

Acabamos  de  demostrar: 


Teorema  35.  El  vector  de  las  derivadas  parciales  de  una  función 
de  M2  en  M es  perpendicular  a las  curvas  de  nivel  de  esta  función. 

De  hecho,  si  uno  se  fija  en  el  plano  de  Covadonga  (Figura  4),  espe- 
cialmente en  la  zona  nordeste,  se  observa  que  las  curvas  de  nivel. . . son 
perpendiculares  a la  pendiente  máxima-,  esto  es  especialmente  visible 
en  la  zonas  donde  la  pendiente  es  muy  alta  (donde  la  densidad  de  las 
curvas  de  nivel  es  muy  grande):  se  ve  claramente  que  las  curvas  de  ni- 
vel son  “muy  paralelas”  (además  de  estar  muy  juntas):  de  hecho,  son 
paralelas  porque  porque  la  pendiente  “cae”  (o  sube)  en  la  dirección 
perpendicular. 

Esto  es  general,  en  cualquier  dimensión. 

Definición  65.  Sea  / : X c — > M una  función  derivable  en 

el  punto  a G A",  interior  de  X.  Se  llama  vector  gradiente  de  / en  a al 
vector  “de  las  derivadas  parciales” : 


Se  llama  campo  gradiente  al  vector  gradiente  “en  todos  los  puntos”  en 
que  existe. 

Definición  66.  Sea  / : I C K"  ->  1 una  función  de  un  abierto 
de  Mn  en  M.  Se  llaman  conjuntos  de  nivel  de  / a los  subconjuntos  de 
la  forma 

{f(x i,  ...,£„)=  c|  c e M}  , 
es  decir,  a los  conjuntos  en  que  / es  constante. 

Se  tiene  el  resultado  general  siguiente: 

Teorema  1.  Sea  f : X c Mn  — > M una  función  diferenciable  en 
un  abierto  X y a G A"  un  punto  de  X.  El  gradiente  de  f en  a es 
perpendicular  al  (único)  conjunto  de  nivel  de  f que  pasa  por  a. 

Y,  lo  que  es  más:  el  gradiente  indica  la  dirección  de  máxima  pen- 
diente. 
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Teorema  36.  Sea  f : X c M2  — » M una  función  del  plano  diferen- 
ciable  en  un  punto  a interior  a X . Sea  Daf  su  diferencial.  Considérese 
la  aplicación: 

~ ™ fe® 

definida  en  el  intervalo  compacto  [ — 7r,  7 r]  (a  cada  vector  de  la  circunfe- 
rencia se  le  envía  en  el  valor  de  la  diferencial  aplicada  a ese  vector).  El 
máximo  de  p se  da  cuando  el  vector  (cos(í),  sen(í))  está  en  la  misma 
dirección  que  Va(/). 

De  hecho  el  enunciado  es  cierto  en  Mn,  pero  es  simplemente  más 
pesado  de  enunciar  (habría  que  hablar  de  variedades,  y no  quiero  ha- 
cerlo). La  función  p(t)  de  enunciado  se  podría  llamar  “pendiente  en  la 
dirección  de  ángulo  í” , por  eso  la  he  denotado  con  la  letra  p. 


7.  Derivadas  de  orden  superior 

Aunque  solo  las  vamos  a utilizar  para  los  problemas  de  optimiza- 
ción, las  funciones  derivadas  parciales  pueden  ser  susceptibles  de  dife- 
renciación y de  dervación  parcial  (no  dejan  de  ser  funciones  por  el  hecho 
de  ser  unas  especiales).  Considérese  una  función  / : X C Mn  — > M de 
un  abierto  de  en  M, 

f(x  i,  ...,xn) 

diferenciable.  Sus  derivadas  parciales 

d¿  d¿ 

dxi ’ ’ ’ ’ ’ dxn 

se  pueden  considerar  funciones  también  de  X en  M, 

df_(  \ df_  df_ M _ df_ 

dx dXl  dxnya)  ' dxn  a 

y pueden  perfectamente  ser  diferenciables,  y así  sucesivamente. . . Se 
utiliza  más  o menos  la  siguiente  nomenclatura: 

Definición  67.  Una  función  / : Á c 1"  ->  K de  un  abierto  de 
Mn  en  M es  diferenciable  k veces  con  continuidad  si  es  diferenciable,  sus 
derivadas  parciales  lo  son  y son  continuas  y las  de  estas  también,  y son 
continuas  y así  hasta  k veces,  con  continuidad. 


7.  DERIVADAS  DE  ORDEN  SUPERIOR 


103 


no  se  escriben  así  Como  estamos  “derivando”  varias  veces,  lo  indica- 
mos poniendo  el  orden  de  derivación  en  el  signo  d y como  hemos  de 
indicar  con  respecto  a qné  variables,  lo  decimos  abajo: 

d2f  d2f 
dx\  ’ ” ’ ’ dxndx\  ’ 

nótese  cómo  cuando  se  deriva  varias  veces  con  respecto  a la  misma 
variable,  se  pone  un  exponente  en  la  variable. 

Por  otro  lado,  resulta  fundamental  el  siguiente  teorema: 

Teorema  37  (Regla  de  Schwartz).  Sea  f : X c Mn  — » M una 
función  doblemente  diferenciable  con  continuidad,  y sean  Xi  y Xj  dos 
coordenadas.  Entonces: 

d2f  _ d2f 

dxidxj  dxjdxi  ’ 

es  decir,  en  “buenas  condiciones”  (que  se  cumplirán  en  todos  los  ejem- 
plos), las  derivadas  cruzadas  coinciden. 


Esta  regla  simplifica  el  cálculo  de  las  derivadas  parciales  de  orden 
superior  (en  cada  orden  hace  falta  calcular  “la  mitad”  de  derivadas 
parciales  cruzadas,  no  todas  ellas).  La  condición  de  continuidad  es, 
como  se  dice  en  el  enunciado,  la  continuidad  es  necesaria,  pero  salvo 
aparición  de  denominadores  u otros  problemas,  se  verificará  “siempre” . 
El  (contra)ejemplo  clásico  (en  el  cual  hay  un  denominador,  claro)  es: 


f(x,y) 


:y{f+yz]  si  (x,y)  (0,0) 

0 si  (x,y)  = (0,0) 


que  es  derivable  dos  veces  en  el  origen,  pero  las  parciales  no  son  conti- 
nuas en  el  origen. 


7.1.  El  Hessiano.  Especial  importancia  tiene  la  matriz  que  se 
obtiene  al  calcular  las  derivadas  parciales  segundas  de  una  función  dos 
veces  diferenciable  con  continuidad: 


Definición  68.  Sea  / : X c Mn  — > M una  función  dos  veces 
diferenciable  con  continuidad  en  un  punto  a € X.  Se  denomina  hessiano 
de  / en  a a la  matriz  (simétrica)  de  sus  derivadas  parciales  de  segundo 
orden: 


Ha(f) 


/ dfi  d2.f  d2f  \ 

dx2  8x28x1  ' ' ' dxndxi 

d°-f  d2f  d2f 

dx\dx2  dx‘2  ' ' ' dxndx2 

d2f  d2f  d2f 

\dx\8xn  dx2dxn  ' ' ' dxndxn  / 


Como  en  condiciones  normales  (cuando  las  derivadas  parciales  se- 
gundas son  continuas,  cosa  que  ocurre  generalmente ) el  hessiano,  por  la 
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Regla  de  Schwartz  es  una  matriz  simétrica,  se  puede  entender  que  de- 
fine una  forma  bilineal  simétrica  en  el  espacio  vectorial  Mn.  De  hecho, 
uno  siempre  puede  calcular  el  siguiente  producto  de  vectores,  dados 
u,  v G 


8.  Función  implícita,  inversión  de  derivadas  parciales, 

“Taylor”  implícito 

So,  what  about  this? 


9.  Extremos  locales  ó “relativos” 


Uf:  dijimos  hace  mucho  tiempo  que  el  Cálculo  está  orientado,  entre 
otras  cosas,  a los  problemas  de  optimización.  Pero  no  hemos  optimizado 
más  que  un  par  de  tonterías  en  el  primer  tema,  ¿Qué  hay  de  todo  eso? 

Consideremos  una  función  / : X — » M.  donde  X es  un  abierto  de 
Rn.  Vamos  a tratar  de  encontrar  condiciones  que  determinen  que  un 
punto  aG  X sea  un  máximo  o un  mínimo  de  /,  o al  menos  un  máximo 
o mínimo  “local”. 

9.1.  Primera  condición:  diferencial  nula.  Observemos  la  Fi- 
gura 5,  que  representa  la  función  f(x,y ) = 1 — x2  — y2  — 2sen(x+i/)  en  el 
rectángulo  [—2,  2]  x [—2,  2],  Está  claro  que  hay  un  punto  (xo,  y o)  (cuyas 
coordenadas  desconocemos  todavía)  que  es  especial : cerca  de  él  los  valo- 
res de  f(x,  y)  son  menores  que  /(a,  b ) — o al  menos  menores  o iguales — . 
Este  punto  es  un  máximo  local.  Si  en  lugar  de  f(x,y ) < f(a,  b ) se  tiene 


-5 


c 


0 
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2-2 


Figura  5.  Un  máximo  local. 

que  f(x,y ) > f(a,b ) cerca  (es  decir,  en  un  entorno ) de  (a,  b),  entonces 
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se  habla  de  (claro)  un  mínimo  local.  Estas  dos  nociones  caen  bajo  el 
concepto  de  extremo : 

Definición  69.  Sea  / : I c K"  -*  1 una  función  definida  en  un 
conjunto  de  I"  y P 6 X un  punto  de  A".  Se  dice  que  P es  un  máximo 
local  de  / en  X si  existe  una  bola  centrada  en  P,  digamos  Br(P)  tal 
que  f{x)  < f(P ) para  todo  x € X fl  Br(P).  Se  dice  que  es  un  mínimo 
local  si  f(x)  > f(P ) para  todo  x € A"  fl  Br(P).  En  cualquiera  de  los 
dos  casos,  se  dice  que  P es  un  extremo  local  de  /. 

El  hecho  de  que  P sea  un  extremo  local  de  / no  implica  que  P 
sea  un  extremo  global  de  f.  No  hay  que  insistir  mucho  en  esto,  basta 
observar  la  Figura  6:  el  origen  (en  este  caso  sí  es  el  origen)  es  claramente 
un  máximo  local , pues  cerca  de  (0,  0)  la  función  vale  menos  de  lo  que 
vale  en  (0,0),  pero  obviamente  el  origen  no  es  un  máximo  global,  pues 
como  se  ve,  hay  muchos  puntos  cerca  del  borde  en  los  cuales  el  valor 
de  / es  mayor  que  /(0,  0). 


Figura  6.  Otro  máximo  local. 

Definición  70.  Se  dice  que  un  punto  Pe  A"  es  un  máximo  global 
de  / : X — > M si  /(P)  > f{x)  para  todo  x G X.  Se  dice  que  es  un 
mínimo  global  si  la  condición  es  /(P)  < f{x).  En  cualquier  caso,  se 
habla  de  extremo  o de  extremo  global. 

El  problema  es  que  el  conjunto  X puede  ser  muy  raro.  La  búsqueda 
de  máximos  y mínimos  siempre  comienza  por  los  extremos  locales,  pues 
son  los  primeros  puntos  susceptibles  de  serlo.  Si  no  lo  son,  entonces  se 
ha  de  recurrir  a técnicas  más  sofisticadas. 

En  los  ejemplos  de  las  Figuras  5 y 6,  se  puede  observar  claramente 
que  en  el  máximo,  el  plano  tangente  a la  gráfica  de  f es  horizontal.  Esto 
debería  ser  obvio:  si  un  punto  P es  un  máximo  local  y la  función  / es 
diferenciable,  entonces  al  dibujar  el  plano  tangente  a / por  (P,  /(P)), 
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este  no  puede  estar  inclinado,  pues  eso  querría  decir  que  en  alguna 
dirección  la  gráfica  de  / crecería  (y  estamos  suponiendo  que  P es  un 
máximo  local,  la  función,  cerca  de  P,  no  crece).  Del  mismo  modo,  en 
un  mínimo,  el  plano  tangente  tiene  que  ser  horizontal.  De  hecho,  esto 
es  general: 

Teorema  38.  Sea  f : I c l2  — > R una  función  de  2 variables  y 
a G X un  punto  interior  de  X . Si  a es  un  extremo  local  de  f , entonces 
el  plano  tangente  a f en  (a,  / (a))  es  horizontal. 

Demostración.  Supongamos  que  no.  Sean  a = (xo,yo)  las  coor- 
denadas de  a.  Entonces  el  plano  tangente  tendrá  ecuación  z = A{x  — 
Xo)  + B(y  — y0)  + /(a),  lo  cual  quiere  decir  que  existe  un  infinitésimo 
d tal  que 

/(a  + h)  = /(a)  + Ahí  + Bh2  + \\h\\d(h). 

Supongamos  que  A ^ 0 (y  pongamos  que  A > 0,  si  es  A < 0 se  cambia 
de  signo  todo).  Cuando  h es  muy  pequeño,  el  ||ñ||d(ñ)  es  mucho  más 
pequeño  que  Ahí,  así  que,  esencialmente, 

/(a  + (hi,  0))  = /(a)  + Ahí, 

pero  esto  quiere  decir  que  f(a  + (hi,  0))  > /(a)  (pues  A y h\  se  pueden 
tomar  positivos)  para  puntos  todo  lo  cerca  que  se  quiera  de  a.  Por 
tanto,  A no  puede  ser  distinto  de  0.  Lo  mismo  pasa  con  B.  □ 


Pero  no  nos  olvidemos  de  que  el  plano  tangente  viene  determinado 
por  la  diferencial,  o si  se  quiere,  por  las  parciales.  El  hecho  de  que  el 
plano  tangente  sea  horizontal  en  (a,  /(a))  no  significa  más  que  Daf 
es  la  aplicación  nula,  es  decir  Ja(f)  = (0  0)  — la  matriz  jacobiana  es 
nula — , es  decir: 


Teorema  39.  Si  (a,  /(a))  es  un  extremo  local  de  f : X c 
en  un  punto  interior  de  X,  entonces 

d¿  =0  d¿ 

dx  ’ dy 


= 0. 


De  hecho,  esto  es  general  para  todas  las  dimensiones: 


Teorema  40.  Si  (a,  / (a))  es  un  extremo  local  de  f : X c Mn  — > M 
en  un  punto  interior  de  X , entonces 


df 

df 
= o, 

= o, . 

df 

dx  i 

a 'dx2 

J 

a 

dx2 

Pero,  cuidado,  no  basta  esta  condición  para  garantizar  que  un  punto 
es  un  extremo  local.  En  la  Figura  7 se  observa  un  ejemplo  clásico  (el 
denominado  paraboloide  hiperbólico,  comúnmente  conocido  como  silla 
de  montar)  de  función  que  en  (0,  0)  tiene  parciales  nulas  pero  para  la 
que  (0,  0)  no  es  ni  máximo  local  ni  mínimo  local.  Se  ve  que  en  una 
dirección  la  función  crece  y en  otra  decrece.  La  función  es  f(x,y)  = 
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x2  — y2,  que  claramente  “crece”  en  la  dirección  x y “decrece”  en  la 
dirección  y. 


Figura  7.  Punto  de  silla. 

Una  condición  suficiente  para  garantizar  un  extremo  local  es  la  si- 
guiente en  Mn: 

Teorema  41.  Sea  Ha(f ) el  hessiano  de  f en  un  punto  a £ X c Mn 
interior  del  dominio  de  definición  de  f : X —>  M.  Si  Ha(f ) define  una 
forma  bilineal  simétrica  definida  positiva,  entonces  a es  un  mínimo 
local.  Si  Ha(f ) define  una  forma  bilineal  simétrica  definida  negativa, 
entonces  a es  un  máximo  local. 

Pero  no  siempre  ocurre  así:  considérese  f(x,y ) — (x  — y)2  = x2  — 
2 xy  + y2.  Está  claro  (o  debería  estarlo)  que  (0,0)  es  un  extremo  local 
(pues  /( 0,0)  < f(x,y)  para  cualquier  (x,y))  y también  global.  Sin 
embargo, 

»m(f)  = (_22  ~22). 

que  no  es  una  forma  definida,  pues 


mientras  que  si  fuera  definida,  el  producto  de  (1, 1)  consigo  mismo 
usando  la  matriz  cuadrada  del  hessiano  debería  ser  distinto  de  0. 

Definición  71.  Sea  / : X c — *•  M una  función  y a e X un 

punto  interior  de  X en  el  que  / es  diferenciable.  Se  dice  que  a es  un 
punto  critico  de  / si  Da(f ) = 0,  es  decir,  si  la  diferencial  es  la  aplicación 
nula.  En  otras  palabras,  si  todas  las  derivadas  parciales  de  / en  a son 
nulas. 
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Los  puntos  críticos  son  “lo  que  uno  busca”  para  encontrar  extre- 
mos. A la  hora  de  saber  si  es  máximo  o mínimo,  lo  primero  que  se 
hace  es  estudiar  el  Hessiano  (si  es  que  / es  dos  veces  diferenciable  con 
continuidad). 

En  la  práctica,  se  utiliza  uno  de  los  siguientes  resultados: 

Teorema  42.  Si  a E X es  un  extremo  de  f : X c — > M (se 
supone  que  a es  un  punto  interior  de  X).  Si  f es  dos  veces  diferenciable 
con  continuidad  y Ha(f ) es  su  hessiano  en  a,  entonces: 

■ Si  todos  los  autovalores  de  Ha(f ) son  estrictamente  positivos, 
entonces  a es  un  mínimo  local. 

■ Si  todos  los  autovalores  de  Ha(f ) son  estrictamente  negativos, 
entonces  a es  un  máximo  local. 

■ En  cualquier  otro  caso,  no  se  sabe. 

A veces  puede  ser  más  sencillo  no  calcular  los  autovalores,  sino 
utilizar  los  menores  principales  (es  decir,  los  determinantes  que  se  ob- 
tienen tomando  las  sucesivas  matrices  cuadradas  que  comienzan  en  el 
elemento  superior  izquierdo,  hacia  abajo  y la  derecha). 

Teorema  43.  Como  en  el  teorema  anterior,  sea  Ha(f ) el  hessiano 
de  f en  a (en  las  mismas  condiciones).  Sean  Ai, . . . , An  los  menores 
principales  de  Ha(f).  Entonces: 

• Si  Ai  > 0,  ...,An  > 0 (todos  son  estrictamente  positivos), 
entonces  a es  un  máximo  local. 

■ Si  Ai  < 0,  A2  > 0, . . . , (— l)nAn  > 0 (es  decir,  los  menores 
tienen  signos  alternos  empezando  por  negativo  y son  no  nulos), 
entonces  a es  un  máximo. 

■ En  cualquier  otro  caso,  no  se  sabe. 


Téngase  en  cuenta  que  el  Teorema  42  y el  43  son  equivalentes : si  uno 
decide,  el  otro  también  y si  uno  no  lo  hace,  el  otro  tampoco  (así  que, 
por  favor,  no  intentar  “usar  uno  cuando  el  otro  falla”). 

Y ¿qué  pasa  en  los  casos  en  que  no  se  sabel  Pues  que  habrá  que 
pensar  un  poco:  habitualmente  un  razonamiento  físico  o un  estudio 
más  detallado  de  la  función  en  cuestión  puede  concluir.  En  la  Figura  8 
se  puede  ver  que  el  origen  (marcado  en  verde)  es  un  punto  crítico  (de 
hecho,  es  un  mínimo  local,  aunque  no  sea  mínimo  estricto)  pero  la 
función  f(x,y ) = (x  + y)2  tiene  por  hessiano  en  (0,  0)  la  matriz 


Hm(f) 


cuyos  menores  principales  son  Ai  = 2,  A2  = 0,  así  que  el  criterio  de 
los  menores  no  decide.  Pero  en  este  casso  concreto,  uno  “sabe2”  que  la 
función  f(x,  y)  — (x  + y)2  no  puede  ser  negativa , pues  es  un  cuadrado, 
así  que,  si  en  un  punto  vale  0,  entonces  en  ese  punto  la  función  tiene 
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FIGURA  8.  Punto  crítico  con  hessiano  no  definido. 

un  mínimo  (puede  que  no  estricto,  pero  sí  un  mínimo).  Por  tanto,  el 
punto  (0,  0)  es  un  mínimo  (de  hecho,  global)  de  /. 

10.  Optimización  restringida:  Lagrange 

Una  vez  que  uno  sabe  calcular  extremos  locales  de  funciones  de 
varias  variables,  aterriza  en  el  mundo  real  y se  da  cuenta  de  que,  casi 
siempre,  los  problemas  de  optimización  son  de  naturaleza  distinta:  se 
buscan  puntos  óptimos  de  funciones  sujetos  a condiciones.  El  ejemplo 
más  sencillo  quizás  es: 

Ejemplo  17.  Se  tiene  un  alambre  de  64cm.  Calcular  las  dimen- 
siones de  un  paralelogramo  limitado  por  ese  alambre  que  tenga  área 
máxima. 

El  problema  de  este  ejemplo  es  sencillo  de  trasladar  a ecuaciones.  Si 
un  paralelogramo  tiene  dimensiones  l x h (largo  por  ancho),  entonces 
si  P es  el  perímetro  y S el  área  que  encierra 

P(l,h)=2(l  + h),  S(l,  h,  a)  — Ih 

Y el  problema  concreto  consiste  en  hallar  el  máximo  de  S(l,h)  con- 
dicionado a la  restricción  P(l,  h)  = 64  (asumimos  que  l y h están  en 
centímetros).  ¿Cómo  proceder? 

Es  importante  darse  cuenta  de  que  el  problema  no  tiene  nada  que 
ver  con  encontrar  un  extremo  de  S:  pues  — evidentemente — el  área  solo 
tiene  mínimos  (ademas  estos  ocurren  cuando  una  de  las  dimensiones  es 
0)  y no  tiene  máximos. . . 

Fijémonos  en  la  Figura  9,  que  muestra  los  valores  de  una  función 
(como  puntos  de  color)  f(x,y ) y la  gráfica  de  una  curva  de  nivel  de 
otra  función  g(x,  y).  En  este  caso,  f(x,  y)  = x + y y g(x,  y)  = x2  + y2 
y en  la  curva  que  se  dibuja,  x2  + y2  = 64  (una  circunferencia  de  radio 
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8).  Supongamos  que  se  trata  de  buscar  el  máximo  de  f(x,y ) = x + y 
condicionado  a que  x2  + y2  = 64,  es  decir,  el  máximo  de  / “sobre  la 
curva” . 


-10  -5  0 5 10 


max 


min 


FIGURA  9.  Optimización  condicionada:  el  valor  máximo 
de  f(x,y)  = x + y en  la  circunferencia  x2  + y2  = 64  es 
el  punto  “rojo”,  el  mínimo  el  “azul”:  donde  las  rectas 
x + y — c son  tangentes  a la  circunferencia. 

En  la  figura  se  han  marcado  los  dos  extremos,  el  máximo  (en  rojo) 
y el  mínimo  (en  azul).  Los  colores  indican  los  valores  de  la  función 
f(x,y ) — x + y (es  decir,  sus  curvas  de  nivel,  que  son  las  rectas  x + y = 
c),  hacia  el  azul  son  menores  y hacia  el  rojo  son  mayores. 

Si  uno  se  fija  en  la  Figura  10,  que  es  la  ampliación  de  una  parte  de  la 
anterior,  se  observa  que  la  curva  g(x,  y)  = 0 (que  es  una  curva  de  nivel 
de  g(x,  y))  es  transversal  a las  curvas  de  nivel  de  f(x,  y)  — c (que  son  las 
rectas  de  color).  Como  el  campo  gradiente  de  / es  perpendicular  a las 
curvas  de  nivel  de  / y el  de  g a las  de  esta,  resulta  que  en  este  punto,  los 
gradientes  van  en  direcciones  distintas.  Es  sencillo  darse  cuenta  de  que, 
como  el  gradiente  V/  indica  la  dirección  de  crecimiento  de  f(x,y),  si 
uno  se  desplaza  sobre  la  curva  g(x,y)  = 0,  los  valores  de  f(x,y ) crecen 
en  una  dirección  (en  la  de  V/)  y decrecen  en  la  contraria. 

Por  el  contrario,  en  la  zona  del  máximo,  en  la  Figura  11,  se  observa 
que  los  vectores  Wg  y V/  tienen  la  misma  dirección  y,  en  este  caso 
concreto,  si  uno  “se  desplaza”  sobre  la  curva  g(x,  y)  = 0 cerca  del  punto 
estudiado,  los  valores  de  f(x,y)  decrecen  en  los  dos  sentidos  (así  que 
este  punto  es  un  máximo  para  / con  la  condición  g(x,y ) = 0). 

En  realidad,  lo  que  se  puede  concluir  es  lo  siguiente: 

Teorema  44.  Sea  f(x,  y)  una  función  de  M2  en  M y g(x,  y)  — c = 0 
una  condición.  Se  supone  que  f y g son  diferenciables  con  continuidad. 
Para  que  un  punto  P = (xo,yo)  sea  un  extremo  de  f condicionado 
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Figura  10.  Zoom  de  una  zona  transversal  entre 
f(x,y ) = c y g(x,y ) = 0.  La  flecha  verde  es  el  gradien- 
te de  f(x,y ) en  un  punto  P y la  negra,  el  de  g(x,y ) en 
el  mismo  punto.  Tienen  direcciones  distintas.  Cada  línea 
de  color  es  una  línea  de  nivel  de  /,  así  que  / no  puede 
tener  un  extremo  en  P,  pues  los  valores  de  / crecen  en 
la  dirección  de  la  flecha. 

a g(x,y ) — c = 0 es  necesario  que  el  gradiente  de  f y el  de  g sean 
proporcionales  en  P. 

De  este  resultado  se  deduce  una  manera  de  calcular  los  posibles 
extremos  condicionados:  se  plantea  la  condición  g(x,y)  — c = 0 y las 
condiciones  V/  = XV  g,  para  cierto  A,  que  son: 


df_  = x^9_  d¿  = 


dx  dx  ’ dy  dy 


de  manera  que  se  tienen  las  ecuaciones: 


g(x,y)  - c = 0 


que  son  tres  ecuaciones  con  tres  incógnitas:  x,y  y A.  Así  que  este  sistema 
“se  puede  resolver”  (pero  por  lo  general,  no  se  podrá  resolver  a mano). 

Insisto  en  que  lo  que  se  obtiene  cuando  se  resuelven  esas  ecuaciones 
son  posibles  extremos.  Habrá  que  hacer  en  cada  caso  un  análisis  más 
fino  para  saber  si  los  puntos  obtenidos  son  máximos,  mínimos  o bien 
no  son  extremos,  como  en  la  figura 

Para  funciones  de  más  variables,  se  tiene  el  mismo  resultado: 
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Figura  11.  Zoom  de  una  zona  de  tangencia  entre 
f(x,  y)  — c y g(x,y ) = 0.  La  flecha  verde  es  el  gradiente 
de  f(x,y ) en  un  punto  P y la  negra,  el  de  g(x,y ) en  el 
mismo  punto.  Tienen  la  misma  dirección.  Cerca  de  P,  los 
valores  de  / en  la  curva  “decrecen  en  los  dos  sentidos”: 
si  uno  se  mueve  (sobre  la  curva)  en  una  dirección  o en 
otra,  el  valor  de  / decrece.  El  punto  P es  un  máximo  de 
/ condicionado  a g(x,y)  = 0. 


Figura  12.  Un  punto  en  que  el  gradiente  de  f(x,y ) 
y el  de  una  curva  g(x,y ) son  paralelos  pero  que  no  es 
extremo  condicionado  (pues  los  valores  de  / crecen  en 
ambas  direcciones  sobre  la  curva  g(x,y ) = 0.) 

Teorema  45.  Sean  /,  g : W 1 — M funciones  de  n variables  diferen- 
ciabas con  continuidad.  Se  supone  que  V(Xli...,Xn)<7  es  no  nulo  en  todo 
el  conjunto  g(x i, . . . , xn)  = 0.  Si  P es  un  extremo  de  f condicionado  a 
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g(xi, , xn)  = 0,  entonces  existe  A G M tal  que 

Vp/  = A Vpg. 

Es  decir,  para  buscar  los  extremos  condicionados  con  una  sola  con- 
dición, se  ha  de  escribir 

í df  df  \ _ í dg  dg  A 

V dxi  p ’ " ' ’ dxn  p)  \dXl  /"•’  dxn  p)  ’ 

que,  junto  con  g(x i, . . . , xn)  = 0 da  un  sistema  de  n + 1 ecuaciones  con 
n + 1 incógnitas. 

Ejemplo  18.  Se  tiene  una  plancha  de  lOOcm2  de  aluminio  y se 
quiere  hacer  una  caja  paralelepipédica  de  volumen  máximo.  ¿Qué  di- 
mensiones tiene? 

Llamemos  a las  variables,  a,l,h  (ancho,  largo,  alto).  Se  ha  de  op- 
timizar la  función  V(a,l,h ) = alh  con  la  restricción  S(a,l,h ) = 100, 
donde  la  función  S es 

S(a,  l,  h)  = 2 (al  + ah  + Ih). 

Calculemos  los  vectores  gradientes: 

V(aj,/i)V  — (lh,ah,al),  (a,i,h)S  = (2(1  + h),  2(a  + h),  2(a  + /)). 

Así  que  las  ecuaciones  quedan: 

Ih  = 2A  (l  + h) 
ah  = 2A  (a  + h) 
al  — 2A(a  /) 

2 (al  + ah  + Ih ) — 100  = 0 

(obsérvese,  y esto  se  hace  siempre,  que  la  constante  de  la  restricción  se 
pone  en  el  primer  miembro,  por  costumbre). 

Utilizando  WolframAlpha  (téngase  cuidado  porque  es  un  poco  de- 
licado con  los  nombres  de  las  variables,  conviene  usar  x,  y,z,t  o bien 
xl,x2, . . . ): 


(no  hay  ni  siquiera  que  indicarle  que  queremos  resolver  el  sistema),  se 
obtienen  dos  resultados: 

y como  las  magnitudes  no  pueden  ser  negativas,  solo  es  válida  la  se- 
gunda solución.  ¿Por  qué  se  sabe  que  es  automáticamente  un  máximo? 
El  volumen,  por  tanto,  que  se  puede  abarcar  con  un  área  de  lOOcm2 
es  125  • !^|  ~ 68,04cm3 ....  Como  debería  saber  todo  el  mundo,  el 
paralelepípedo  es  un  cubo. 

Si  en  lugar  de  una  condición  se  tienen  varias,  hay  que  utilizar  varios 
parámetros,  Ai,...,Ar  (claro,  uno  por  cada  condición)  e imponer  la 
condición  de  que  el  gradiente  de  / sea  una  combinación  lineal  de  los 


114  5.  CÁLCULO  [DIFERENCIAL]  EN  VARIAS  VARIABLES 

gradientes  de  las  gt  (esto  es  sencillo  pero  no  trivial).  Al  final  se  tienen 
tantas  ecuaciones  como  incógnitas. 

Teorema  46.  Sean  funciones  de  Mn  en  M.  diferen- 

ciables.  Se  supone  que  los  vectores  Vq^i,  . . . , V Qgm  son  linealmente 
independientes  en  el  todos  los  puntos  Q = (xi,...,xn))  del  conjunto 
gi  = 0,  = 0 (la  condición,).  Si  P G Mn  es  un  extremo  de  f 

condicionado  a g\  = 0, . . . , gm  = 0 entonces  existen  números  reales 
Ai, . . . , Xm  tales  que 

VP/  = A]Vp<7i  + • • • + A mV  pgm- 

Así  que,  junto  con  las  condiciones  cq  = 0, . . . , gm  — 0 se  obtiene 
un  sistema  de  m + n ecuaciones  con  m + n incógnitas,  que  “puede 
resolverse” . 

10.1.  El  Lagrangiano.  . . En  ocasiones  se  utiliza  la  siguiente 
nomenclatura.  Se  supone  que  f(x i, . . . ,xn)  es  una  función  de  n varia- 
bles que  se  quiere  optimizar  con  las  restricciones  g\  = 0, . . . , gm  = 0 
(funciones  de  n variables  también,  las  gt).  Todas  las  funciones  se  supo- 
nen diferenciables,  etc.  Entonces 

Definición  72.  El  lagrangiano  del  problema  de  optimización  de  / 
con  las  restricciones  g\  — 0, . . . , gm  — 0 es  la  función  de  n + m variables 

A(^i , . . . , xn}  Ai , . . . , Am) 

f (^  1 1 ■ • • i 3'n)  Ai^i  (2^1 , • • • , Xqf)  ' A m9m  1 1 ■ • • t J'n) 

Y la  resolución  del  problema  de  optimizacón  de  / con  las  restric- 
ciones gi  = 0 se  reduce  a buscar  los  puntos  críticos  de  A: 

V pA(^i, . . . , xn:  Ai, . . . , Am)  0, 

que  da  las  ecuaciones  de  los  Teoremas  45  y 46  cuando  se  escriben  todas 
ellas  (puesto  que  A es  una  función  de  n + m variables,  las  aq  y las  A,). 

A las  variables  A ¿ (o  a sus  valores  una  vez  resuelto  el  problema  de 
optimización)  se  las  denomina  multiplicadores  de  Lagrange. 

10.2.  Significado  de  los  multiplicadores. 

10.3.  Optimización  con  desigualdades.  En  “la  vida  real”  (si 

Fixm e:¿Dejar  esto]  es  O116  es^°  existe),  la  optimización  no  siempre  está  sujeta  a condiciones 

para  que  lo  presenten?  de  igualdad*.  Por  ejemplo 
(activa/inactiva. . . ) 

Ejemplo  19.  Se  tiene  una  plancha  de  lOOcm2  de  aluminio  y se 
quiere  hacer  una  caja  paralelepipédica  de  volumen  máximo  de  manera 
que  el  perímetro  sea  menor  de  15cm  ¿Qué  dimensiones  tiene? 


